Công ty khởi nghiệp AI được Nvidia hỗ trợ phát hành hình đại diện thể hiện cảm xúc của con người

Là một nhà đầu tư tiền điện tử có nền tảng về công nghệ và trí tuệ nhân tạo, tôi rất vui mừng về bản nâng cấp hình đại diện AI mới nhất của Synthesia. “Avatar biểu cảm” của họ có khả năng cách mạng hóa cách các doanh nghiệp giao tiếp thông qua các phương tiện kỹ thuật số.


Một công ty AI có tên Synthesia, nhận được sự hỗ trợ từ Nvidia, gần đây đã tiết lộ một cải tiến. Bản cập nhật này cho phép hình đại diện do AI tạo ra thể hiện chân thực hơn cảm xúc và hành động của con người.

Vào ngày 25 tháng 4, tập đoàn đã công bố “Hình đại diện dựa trên văn bản cảm xúc”. Những hình đại diện này được thiết kế để truyền tải cảm xúc nhằm đáp lại các mệnh lệnh bằng văn bản, khiến chúng phù hợp để sử dụng trong các bài thuyết trình của công ty, tài liệu tiếp thị và các buổi đào tạo.

Là nhà nghiên cứu đang nghiên cứu những tiến bộ mới nhất trong trí tuệ nhân tạo, tôi rất vui mừng được chia sẻ rằng chúng tôi đã đạt được một cột mốc đột phá. Lần đầu tiên, hình đại diện AI có thể hiểu được ý nghĩa đằng sau lời nói của họ.

— Synthesia (@synthesiaIO) Ngày 25 tháng 4 năm 2024

Khả năng tạo video của Sora của OpenAI nổi tiếng nhờ tạo ra hình ảnh chuyển động sống động như thật.

AI có những hạn chế, đặc biệt là khi miêu tả con người một cách chân thực. Thay vì hiển thị chính xác các đặc điểm và chuyển động của chúng, AI có thể hiển thị các bộ phận cơ thể bị biến dạng, hình nền không phù hợp hoặc môi lệch khi nói ra.

Trong bản cập nhật mới nhất, Synthesia tập trung vào việc cải thiện tính năng hát nhép và độ chính xác về cảm xúc cho bot bằng cách sử dụng trình đọc kịch bản thực của con người trong quá trình sản xuất.

Là một nhà nghiên cứu về trí tuệ nhân tạo tiên tiến, tôi đã đọc được một tuyên bố hấp dẫn của Victor Ribarbelli, Giám đốc điều hành và đồng sáng lập của Synthesia. Trong một video gần đây, anh ấy đã nhấn mạnh một lỗ hổng đáng kể trong quá trình phát triển hình đại diện: trong khi con người hiểu và phản ứng một cách tự nhiên với những cảm xúc được truyền tải qua nét mặt, thì hình đại diện lại thiếu khả năng này. Nói một cách đơn giản, cho đến nay, avatar vẫn chưa hiểu được ý nghĩa đằng sau lời nói của chúng ta, điều này đã cản trở trí tuệ cảm xúc của họ.

Trong môi trường studio, các cá nhân được dạy cách thể hiện những cảm xúc cơ bản như vui, buồn và thất vọng một cách chính xác thông qua nét mặt và giọng nói phù hợp để đáp lại những tín hiệu đơn giản.

Với tư cách là một nhà đầu tư tiền điện tử, tôi vui mừng chia sẻ rằng các bản cập nhật hình đại diện mới nhất đi kèm với một bộ tính năng ấn tượng. Giờ đây, chúng có thể truy cập được bằng hơn 130 ngôn ngữ, mang lại trải nghiệm người dùng đa dạng và toàn diện hơn. Ngoài ra, những hình đại diện này có khả năng tạo phụ đề chi tiết của riêng chúng, đảm bảo giao tiếp rõ ràng cho tất cả người dùng. Và nếu điều đó vẫn chưa đủ, họ thậm chí có thể bắt chước giọng nói của người sáng tạo, thêm nét cá nhân hóa cho mỗi lần tương tác.

Trong số các mô hình hình đại diện thể hiện các ngôn ngữ nói không phải tiếng Anh trên trang web của Synthesia, chẳng hạn như tiếng Pháp, tiếng Đức và tiếng Tây Ban Nha, mô hình ngôn ngữ tiếng Anh thể hiện mức độ phức tạp và giống với giọng nói của con người nhất dựa trên đánh giá do CryptoMoon thực hiện.

Với tư cách là một nhà nghiên cứu, tôi đã tìm được những thông tin hấp dẫn về công ty khởi nghiệp này. Theo báo cáo, ít nhất một nửa số công ty Fortune 100 được cho là khách hàng của họ, đây là một thành tích khá ấn tượng. Hơn nữa, họ phục vụ tổng cộng hơn 55.000 doanh nghiệp. Nhóm khách hàng đa dạng này trải rộng trên nhiều ngành công nghiệp khác nhau và bao gồm những cái tên đáng chú ý như Zoom, Xerox, Microsoft và Reuters, cùng nhiều ngành khác.

Được thành lập vào năm 2017, Synthesia là một công ty công nghệ có trụ sở tại Vương quốc Anh và đã có sự tăng trưởng đáng kể. Với sự phát triển vượt bậc của công nghệ trí tuệ nhân tạo (AI) trong năm qua, giá trị của công ty đã tăng vọt lên gần 1 tỷ USD. Các nhà đầu tư đáng chú ý, bao gồm Nvidia – công ty hàng đầu trong lĩnh vực sản xuất chip bán dẫn AI – đã ủng hộ Synthesia.

Với việc tập trung vào việc tạo ra các hình đại diện giống con người thực tế dành riêng cho các ứng dụng kinh doanh, Synthesia đã tránh được một số ồn ào và sự cạnh tranh khốc liệt mà các mô hình chatbot khác như ChatGPT của OpenAI và chatbot Gemini của Google phải đối mặt, có cách tiếp cận rộng hơn.

2024-04-26 15:12