Bốn điều người dùng Google Gemini sẽ sớm có thể thực hiện

Là một nhà đầu tư tiền điện tử dày dạn kinh nghiệm và có mối quan tâm sâu sắc đến công nghệ và trí tuệ nhân tạo, tôi rất vui mừng về việc Google tích hợp mô hình AI, Gemini, vào các sản phẩm của họ. Động thái này không chỉ có ý nghĩa quan trọng đối với Google mà còn đối với ngành công nghệ rộng lớn hơn, vì nó cho thấy tiềm năng của các mô hình ngôn ngữ lớn như Gemini trong việc cách mạng hóa trải nghiệm người dùng.


Hệ thống trí tuệ nhân tạo tiên tiến của Google, Gemini, đang được tích hợp sâu vào nhiều công nghệ của Google. Trong tương lai gần, người dùng sẽ nhận thấy sự hiện diện của nó trong Gmail, YouTube và điện thoại thông minh của Google.

Tại hội nghị nhà phát triển I/O 2024 được tổ chức vào ngày 14 tháng 5, CEO Sundar Pichai đã tiết lộ nơi chúng ta có thể mong đợi tìm thấy mô hình AI của công ty trong tương lai gần.

Trong bài phát biểu quan trọng dài 110 phút tại sự kiện ra mắt Gemini, Pichai đã nhấn mạnh trí tuệ nhân tạo (AI) tổng cộng 121 lần, khiến nó trở thành tâm điểm trong cuộc thảo luận của ông.

Google đang tích hợp mô hình ngôn ngữ lớn (LLM) vào gần như tất cả các sản phẩm của mình như Android, Tìm kiếm và Gmail. Dưới đây là cái nhìn về những gì người dùng có thể dự đoán trong tương lai.

Bốn điều người dùng Google Gemini sẽ sớm có thể thực hiện

Tương tác ứng dụng

Trong cải tiến sắp tới, Gemini sẽ hiểu sâu hơn về ngữ cảnh bằng cách cho phép người dùng tương tác với nhiều ứng dụng khác nhau. Người dùng có thể sớm gọi Gemini để thực hiện các tác vụ như chèn hình ảnh thông minh nhân tạo vào tin nhắn bằng cách kéo và thả nó.

Với tư cách là một nhà nghiên cứu đang nghiên cứu các nền tảng video, tôi có thể đề xuất một cách khác để giải thích tính năng “Hỏi video này” của YouTube. Thay vì nói “Người dùng YouTube cũng có thể nhấn vào ‘Hỏi video này'”, tôi sẽ diễn giải nó là “Người dùng hiện có thể truy vấn AI một cách tương tác để truy xuất thông tin cụ thể trực tiếp từ video YouTube bằng cách sử dụng chức năng ‘Hỏi video này’ .”

Song Tử trong Gmail

Gmail, dịch vụ email của Google, được thiết lập để tích hợp trí tuệ nhân tạo (AI) thông qua một tính năng mới có tên Gemini. Cải tiến này cho phép người dùng dễ dàng tìm kiếm email, tạo bản tóm tắt các tin nhắn đã nhận và soạn thảo phản hồi một cách dễ dàng.

Với tư cách là một nhà đầu tư tiền điện tử, tôi có thể nói với bạn rằng có một số công cụ nâng cao có thể giúp quản lý hộp thư đến email của tôi một cách hiệu quả. Một trong những tính năng này là trợ lý AI có khả năng xử lý các tác vụ phức tạp hơn, chẳng hạn như hỗ trợ quá trình hoàn trả thương mại điện tử. Trợ lý này sẽ có thể quét hộp thư đến email của tôi, tìm các email có liên quan, truy xuất các biên lai đính kèm và thay mặt tôi điền vào các biểu mẫu trực tuyến. Bằng cách tự động hóa những nhiệm vụ lặp đi lặp lại này, tôi có thể tập trung vào những vấn đề đầu tư cấp bách hơn.

Song Tử sống

Với tư cách là nhà nghiên cứu đang nghiên cứu các công nghệ AI tiên tiến, tôi rất vui được chia sẻ rằng Google gần đây đã giới thiệu một tính năng cải tiến có tên là “Gemini Live”. Với trải nghiệm này, người dùng có thể tham gia vào các tương tác bằng giọng nói và đàm thoại toàn diện hơn với AI trực tiếp trên thiết bị di động của họ.

Chatbot mà tôi đang mô tả có thể bị tạm dừng trong quá trình phản hồi để người dùng làm rõ thêm. Nó có khả năng điều chỉnh nhịp điệu lời nói của người dùng trong thời gian thực. Hơn nữa, chatbot này được trang bị các tính năng cho phép nó nhận thức và phản ứng với môi trường vật lý xung quanh. Điều này có thể được thực hiện thông qua hình ảnh hoặc video được ghi lại trên thiết bị.

Bốn điều người dùng Google Gemini sẽ sớm có thể thực hiện

Tiến bộ đa phương thức

Google đang trong quá trình tạo ra các thực thể trí tuệ nhân tạo (AI) tiên tiến có khả năng suy luận, lập kế hoạch và hoàn thành các công việc phức tạp gồm nhiều bước cho người dùng có sự giám sát. Các hệ thống AI này là đa phương thức, cho phép chúng hoạt động với nhiều loại dữ liệu khác nhau như hình ảnh, âm thanh và video ngoài văn bản.

Các ví dụ và trường hợp sử dụng ban đầu bao gồm tự động trả lại hàng khi mua sắm và khám phá một thành phố mới.

Với tư cách là một nhà đầu tư tiền điện tử, tôi rất vui mừng về những tiến bộ sắp tới đối với mô hình AI của công ty. Một trong những cải tiến này bao gồm việc tích hợp Gemini sâu hơn vào hệ điều hành di động Android, thay thế hiệu quả Google Assistant cho một số chức năng nhất định. Điều này có nghĩa là các tương tác mượt mà và liền mạch hơn với các khoản đầu tư tiền điện tử của tôi bằng cách sử dụng nền tảng Gemini trực tiếp trên thiết bị Android của tôi.

Với tư cách là một nhà đầu tư tiền điện tử và là người dùng nhiệt thành của nền tảng Gemini, tôi rất hào hứng với tính năng “Hỏi ảnh” mới cho phép tôi tìm kiếm thư viện ảnh của mình bằng các truy vấn ngôn ngữ tự nhiên. Với công cụ cải tiến này, tôi có thể yêu cầu nó tìm những bức ảnh cụ thể dựa trên bối cảnh, đồ vật hoặc con người. Nó thậm chí còn tóm tắt những kỷ niệm bằng ảnh để trả lời câu hỏi của tôi, giúp tôi dễ dàng sống lại những khoảnh khắc đáng nhớ và dễ dàng xác định được những hình ảnh quan trọng.

Một khả năng: Google Maps sẽ hiển thị thông tin tóm tắt về các vị trí và khu vực, được lấy từ dữ liệu bản đồ của nó, dưới dạng mô tả do AI tạo.

2024-05-15 09:42