AI của Microsoft giúp ảnh chuyển động và nói chuyện

Thứ 2, 22/04/2024 | 15:34:48 [GMT +7] A A

VASA-1, công cụ AI mới của Microsoft, cho phép ảnh chân dung có thể nói, hát với biểu cảm tự nhiên.

Theo Microsoft, không chỉ tạo cử động môi "đồng bộ một cách tinh tế" kèm âm thanh, VASA-1 còn thể hiện thần thái nhân vật thông qua chuyển động khuôn mặt và đầu tự nhiên, từ đó tăng tính chân thực.

Hãng phần mềm Mỹ cho biết đây là "hệ thống động học cho khuôn mặt" được huấn luyện thông qua mô hình tạo chuyển động "tốt hơn một cách toàn diện so với các phương pháp trước đó". AI này hỗ trợ xử lý ảnh chân dung với phần đầu và phần trên của thân, với các biểu cảm vui vẻ, tức giận, ngạc nhiên hoặc nghiêm nghị.

Khả năng của AI Microsoft VASA-1. Video: Microsoft

Trong video được Microsoft giới thiệu trên YouTube, AI của hãng có thể khiến các bức ảnh, tạo bởi Dall-E 3 và StyleGAN2, nói chuyện tự nhiên. Người dùng cũng có thể điều chỉnh thông số khuôn mặt, biểu cảm, giọng nói và nhiều chi tiết khác. Trang chuyên về hình ảnh PetaPixel đánh giá VASA-1 cho khả năng thể hiện tốt hơn so với các AI tương tự, khiến khó nhận biết nếu xem lần đầu.

Microsoft từ chối đề cập mô hình đứng sau, cũng như không có kế hoạch phát hành sản phẩm riêng, hay cung cấp API cho nhà phát triển. Họ giới thiệu VASA-1 "nhằm phô diễn một trong những khả năng của AI".

"Nghiên cứu của chúng tôi tập trung vào phát triển cảm xúc trực quan cho ảnh đại diện AI, hướng tới ứng dụng tích cực", Microsoft viết trên website công ty. "Nó không nhằm tạo nội dung gây hiểu lầm hoặc lừa dối. Tuy nhiên, giống như các mô hình AI khác, nó vẫn có thể bị lạm dụng để mạo danh con người. Chúng tôi phản đối bất kỳ hành vi nào như vậy".

Bên cạnh làn sóng chatbot như ChatGPT hay Google Gemini, lĩnh vực AI cũng chứng kiến cuộc đua giữa các mô hình có khả năng tạo video như thật từ ảnh tĩnh. Tháng trước, Alibaba giới thiệu công cụ tương tự là EMO (Emotive Portrait Alive). Nếu AI trước đó chỉ làm biến đổi miệng và một phần mặt, EMO có thể tạo nét mặt, tư thế, di chuyển phần lông mày, nhíu mắt hay thậm chí lắc lư theo điệu nhạc. Riêng phần miệng được AI thể hiện tự nhiên, đồng bộ môi chính xác.

Một số video được EMO tạo từ ảnh do Alibaba công bố. Video: YouTube/Rinki

Theo Vnexpress

AI của Microsoft giúp ảnh chuyển động và nói chuyện

Ý kiến ()

Cùng chuyên mục

LG ra mắt mô hình hybrid AI đầu tiên của Hàn Quốc

Trung Quốc phóng thành công tàu Thiên Châu-9, tiếp tế cho Trạm vũ trụ Thiên Cung

Australia ứng dụng công nghệ chụp ảnh siêu nét hỗ trợ kiểm dịch sinh học

Lần đầu có app đặt xe container, tích hợp cả thủ tục xuất nhập khẩu

Israel phát triển da nhân tạo sinh học giúp điều trị bỏng nặng

Đột phá trong công nghệ biến CO₂ thành đường ăn

Đoàn giám sát của Quốc hội giám sát công tác bảo vệ môi trường tại Quảng Ninh

Nguồn lực thúc đẩy phát triển kinh tế bền vững

Quần thể di tích và danh thắng Yên Tử - Vĩnh Nghiêm - Côn Sơn, Kiếp Bạc được UNESCO công nhận Di sản thế giới

Khẳng định vị thế là điểm đến đầu tư hấp dẫn

82 triệu tấn - là sản lượng hàng hóa qua các cảng trên địa bàn tỉnh trong nửa đầu năm 2025

3.915 - là số cơ sở nuôi cá nước ngọt tại Quảng Ninh hiện nay

Xây dựng xã Kỳ Thượng trở thành vùng kinh tế lâm nghiệp bền vững, hướng tới phát triển du lịch sinh thái

319.500 tấn - là tổng lượng nông sản xuất khẩu qua địa bàn tỉnh 6 tháng đầu năm nay

Kỳ họp thứ 29 HĐND tỉnh khóa XIV, nhiệm kỳ 2021-2026

Không gian mới - Thời cơ mới

Đại hội Đảng bộ các cấp nhiệm kỳ 2025-2030

Thông tin - Quảng cáo

Thông báo thủ tục chuyển nhượng

Lời cảm tạ

Văn phòng Công chứng Vũ Tiến Luật thông báo thay đổi nội dung đăng ký hoạt động

Ngân hàng Thương mại Cổ phần Công Thương Việt Nam - Chi nhánh Cẩm Phả thông báo thay đổi địa điểm Phòng giao dịch Cẩm Sơn

Thông báo về lễ bốc thăm vị trí và quyền mua căn hộ - Dự án nhà ở xã hội thuộc khu dân cư Đồi Ngân hàng, phường Hồng Hải và phường Cao Thắng, TP Hạ Long

Thông báo Tuyển dụng viên chức vào làm việc tại Trung tâm Kiểm dịch Y tế quốc tế Quảng Ninh năm 2025

Thông báo bán nhà

Công ty Nhiệt điện Đông Triều - TKV tổ chức Hội thảo về công tác tiêu thụ tro xỉ năm 2025

Thông báo về các điểm khu neo đậu và vị trí tự nhiên có điều kiện thuận lợi cho tàu thuyền tránh trú bão trên địa bàn tỉnh Quảng Ninh năm 2025

Thông báo mời gặp mặt đồng hương Đông Triều tại thành phố Hạ Long

Đẩy mạnh chuyển đổi số trong kinh doanh hợp tác xã với phần mềm MISA AMIS Kế toán hợp tác xã

Trở thành designer chuyên nghiệp cùng Fedu Design

Hanotours chia sẻ kinh nghiệm xin visa Trung Quốc nhanh chóng, tỷ lệ đậu cao

Thông báo tuyển dụng viên chức vào làm việc tại Bệnh viện Đa khoa tỉnh Quảng Ninh năm 2025