Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

5/5 - (1)
Chia sẻ qua
Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Hội nghị Google I/O là nơi mà Google hé lộ những sản phẩm và công nghệ đột phá nhất trong năm. Cũng như bao lần, Google I/O 2024 đã không làm chúng ta thất vọng khi mang đến hàng loạt thông tin thú vị và hấp dẫn về trí tuệ nhân tạo (AI) với hoàng loạt cải tiến đầy mới lạ của AI Gemini,… Hãy cùng GCS Vietnam điểm qua những điểm nhấn đáng chú ý nhất trong sự kiện lần này ngay.

Tổng quan về hội nghị Google I/O

Vậy Google I/O là gì? Google I/O dành cho ai? Google I/O là hội nghị thường niên được Google tổ chức nhằm ra mắt cũng như giới thiệu tới người dùng trên toàn thế giới về công nghệ AI sắp ra mắt. 

Ngoài ra, Google I/O còn là sự kiện cũng sẽ dành riêng cho các nhà phát triển, đối tác doanh nghiệp công nghệ cũng như toàn thể người dùng quan tâm đến lĩnh vực phát triển công nghệ trên khắp thế giới.

Đây cũng là sự kiện quan trọng nhất trong năm của ông lớn Google, nơi họ có thể giới thiệu những sản phẩm công nghệ mới nhất, mang tính đột phá và cập nhật về các dịch vụ hiện có.

Tên gọi “I/O” là viết tắt cho từ “Input/Output” và đồng thời cũng mang ý nghĩa là “Innovation in the Open” (Đổi mới sáng tạo không giới hạn). Từ cái tên, chúng ta có thể thấy tinh thần chia sẻ và hợp tác mạnh mẽ của Google với cộng đồng.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Tại Google I/O, các nhà phát triển cũng sẽ có cơ hội tham gia các buổi thuyết trình chuyên sâu, lắng nghe hội thảo về chuyên môn kỹ thuật, đặc biệt là gặp gỡ các chuyên gia của Google, có cơ hội trải nghiệm những sản phẩm mới nhất. Đây cũng là nơi Google công bố những thay đổi quan trọng về các dịch vụ trên nền tảng như Android, Chrome, Google Assistant cũng như các dịch vụ đám mây.

Như vậy, Google I/O không chỉ là sự kiện chuyên về công nghệ thuần túy, mà còn trở thành diễn đàn để cộng đồng nhà phát triển có cơ hội gặp mặt và giao lưu, trao đổi ý tưởng cũng như xây dựng mối quan hệ. Đây cũng là dịp để Google có thể lắng nghe ý kiến phản hồi từ cộng đồng, nhằm mục đích cải thiện các sản phẩm và dịch vụ của mình.

Những cải tiến về Gemini AI

Google I/O 2024 đã đánh dấu bước tiến quan trọng, đột phá trong việc phát triển trí tuệ nhân tạo AI, ứng dụng vào đa nền tảng của Google, đặc biệt là những cải tiến với siêu AI Gemini. Google đã giới thiệu những cải tiến đánh chú ý nhất trong năm trên Gemini, mở ra được tiềm năng ứng dụng rộng lớn cũng như nâng cao trải nghiệm người dùng trên nhiều lĩnh vực khác.

Nâng cấp Gemini 1.5

Thông báo đầu tiên là những cải tiến nâng cấp cho mô hình Gemini 1.5. Với những nâng cấp toàn diện, Gemini 1.5 hứa hẹn sẽ mở ra nhiều khả năng ứng dụng mới cũng như mang lại trải nghiệm tốt hơn trong tương lai.

– Nâng cấp khả năng xử lý ngôn ngữ tự nhiên: Gemini 1.5 đã được trang bị khả năng hiểu và xử lý ngôn ngữ tự nhiên vượt trội và ít mắc lỗi hơn so với các phiên bản trước. Điều này cũng giúp Gemini 1.5 hiểu rõ hơn ý định, yêu cầu của người dùng, từ đó đưa ra được những phản hồi chính xác và phù hợp hơn.

– Mở rộng khả năng phân tích đa phương tiện: Không chỉ giới hạn ở văn bản, Gemini 1.5 còn có khả năng phân tích và trích xuất thông tin từ đa dạng các nguồn dữ liệu từ đa phương tiện như hình ảnh, video, âm thanh như file ghi âm. Tính năng này mở ra tiềm năng ứng dụng rộng rãi của Gemini 1.5 trong các lĩnh vực như tìm kiếm thông tin, sáng tạo nội dung và dịch thuật đa phương tiện.

– Tối ưu hóa hiệu suất: Google cũng đã thực hiện nghiên cứu, phát triển để tối ưu hiệu suất của Gemini 1.5. Nhờ đó, mô hình này sẽ hoạt động nhanh hơn, tiết kiệm năng lượng hơn và cũng dễ dàng triển khai trên nhiều thiết bị khác nhau.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Gemini 1.5 Pro: Trợ lý đa năng trong Google Workspace

Đặc biệt, Google I/O 2024 còn đánh dấu bước tiến vượt bậc trong việc tích hợp Gemini 1.5 Pro vào không gian làm việc Google Workspace. Đây là một phiên bản nâng cấp của Gemini, được thiết kế nhằm trở thành trợ lý đắc lực, hỗ trợ người dùng tối đa hóa hiệu suất làm việc trong môi trường doanh nghiệp.

Gemini 1.5 Pro không chỉ đơn thuần là một mô hình ngôn ngữ lớn, mà giờ đây nó có thể cung cấp các tính năng hỗ trợ thông minh, linh hoạt trong Docs, Sheets, Slides, Drive và Gmail. Cụ thể, Với Gemini 1.5 Pro, người dùng có thể truy xuất thông tin từ Google Drive, soạn thảo email chuyên nghiệp, tạo được slide thuyết trình hấp dẫn, thu hút người xem, phân tích dữ liệu trong Sheets..

Việc tích hợp AI nâng cấp vào không gian làm việc không chỉ giúp doanh nghiệp tự động hóa các tác vụ nhàm chán mà còn mở ra khả năng sáng tạo và hợp tác mới, giúp người dùng tận hưởng trải nghiệm cơ hội làm việc thông minh hơn.

>>Khám phá ngay: Bảng giá chi tiết Gemini for Google Workspace mới nhất 2024 

Mô hình Gemini 1.5 Flash

Tiếp theo, Google I/O 2024 đã chứng kiến sự ra mắt của mô hình AI mới – Gemini 1.5 Flash, một phiên bản mới của Gemini được thiết kế nhằm đáp ứng những nhu cầu xử lý nhanh chóng và hiệu quả của người dùng. Flash có tới 1 triệu tokens mặc định, có nghĩa là bạn có thể sử dụng Gemini 1.5 Flash khi xử lý video dài 1 tiếng, đoạn audio dài 11 tiếng, đoạn code 30,000 dòng hoặc hơn 700,000 từ.

Với các tính năng vượt trội trong việc thực hiện các tác vụ đòi hỏi tốc độ cao, Gemini 1.5 Flash hứa hẹn sẽ mang đến những cách thức ứng dụng thực tiễn đa dạng và mạnh mẽ hơn bao giờ hết.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

–  Đáp ứng các tác vụ tần suất cao: Gemini 1.5 Flash được tối ưu hóa để xử các tác vụ yêu cầu tần suất cao, phản hồi nhanh và độ trễ thấp. Tính năng này làm cho nó trở thành công cụ lý tưởng cho các ứng dụng như chatbot, trợ lý ảo và các hệ thống xử lý ngôn ngữ tự nhiên thời gian thực khác.

– Mở rộng linh hoạt: Gemini 1.5 Flash có khả năng mở rộng linh hoạt, đáp ứng các nhu cầu xử lý lượng lớn dữ liệu và nhiều yêu cầu cùng lúc từ phía người dùng. Điều này giúp làm tăng trải nghiệm người dùng mượt mà, ổn định ngay cả trong môi trường có lượng truy cập cao.

– Tích hợp chặt chẽ với nền tảng của Google: Tính năng tích hợp này giúp Gemini 1.5 Flash tạo điều kiện thuận lợi cho các lập trình viên phát triển và triển khai các ứng dụng AI.

Với những ưu điểm vượt trội, Gemini 1.5 Flash được kỳ vọng sẽ mở ra chương mới trong việc ứng dụng AI vào cuộc sống hàng ngày của chúng ta, từ đó cải thiện trải nghiệm người dùng trên các ứng dụng di động đến việc xây dựng các hệ thống thông minh phức tạp hơn.

Gemini Live

Ngoài ra, tại sự kiện Google I/O vừa qua, Google giới thiệu thêm Gemini Live – một bước tiến mới trong lĩnh vực tương tác giữa người và máy. Tính năng này sẽ hỗ trợ người dùng tương tác trực tiếp với trợ lý AI Gemini bằng giọng nói được thực hiện trên smartphone.

Gemini Live được thiết kế với các tính năng nâng cao trải nghiệm trò chuyện tự nhiên, liền mạch, giống như chúng ta trò chuyện với người thật. Người dùng có thể đặt những câu hỏi khác nhau, yêu cầu trợ giúp hoặc thực hiện các tác vụ khác bằng giọng nói. Sau đó Gemini Live sẽ phản hồi bằng giọng nói tổng hợp tự nhiên, thâm chí thể hiện giọng nói giống như người thật bằng cách ngắt lời giữa câu, hay có giọng nâng lên hạ xuống.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Điểm đặc biệt của Gemini Live được Google nhấn mạnh đó là khả năng “nhìn” thông qua camera của thiết bị di động để đưa ra được những phản hồi phù hợp hơn với ngữ cảnh.

*Ví dụ, người dùng có thể hỏi Gemini Live về món đồ ở trên bàn (khi camera đang hướng về cái bàn), và sau đó trợ lý AI này sẽ gọi tên món đồ và cung cấp thông tin chi tiết về đồ vật đó dựa trên hình ảnh thu được từ Camera. 

Google cũng tiết lộ thêm với người dùng rằng Gemini Live sẽ phát triển thêm tính năng trò chuyện video vào cuối năm 2024. Công nghệ mới này hứa hẹn mở ra nhiều ứng dụng hữu ích đối với các cá nhân yêu thích AI, ví dụ như sử dụng Gemini Live để thực hiện các cuộc phỏng vấn giả lập hoặc hỗ trợ thêm khi người dùng đang ở trong một tình huống thực tế khác.

Tích hợp Gemini Nano trên trình duyệt Chrome

Google đã nghiên cứu thêm và phát triển Gemini Nano khi tích hợp mô hình này vào trình duyệt Google Chrome cho máy tính để bàn tính từ phiên bản 126. Đây được xem là một phiên bản rút gọn của Gemini, được tối ưu hóa để hoạt động hiệu quả trên thiết bị của người dùng hiện nay. Gemini Nano sẽ mang đến trải nghiệm AI trực tiếp trên trình duyệt mà người dùng sẽ không cần kết nối Internet.

Với Gemini Nano, người dùng Chrome có thể trải nghiệm thêm các tính năng AI như:

– Tạo nội dung ngắn gọn, như Email, bài đăng trên mạng xã hội hoặc có thể là đoạn văn bản ngắn gọn, đơn giản dựa trên câu lệnh.

– Dịch thuật các đoạn văn bản hoặc trang web sang ngôn ngữ mà người dùng mong muốn một cách nhanh chóng.

– Tổng hợp, tóm tắt các bài viết, trang web dài, hỗ trợ người dùng nắm bắt thông tin quan trọng dễ dàng.

– Hỗ trợ tìm kiếm thông minh bằng cách đưa ra các thông tin bổ sung hoặc các gợi ý tìm kiếm liên quan để người dùng có thể mở rộng khả năng nghiên cứu.

Việc tích hợp Gemini Nano vào Chrome có thể được xem là bước đi chiến lược của ông lớn Google trong việc phổ cập AI và biến nó thành phần quan trọng không thể thiếu trong cuộc sống hàng ngày của người dùng.

Gemini Imagen 3

Thêm một cải tiến về Gemini đến từ đội ngũ phát triển Google Deepmind đó chính là Gemini Imagen 3 – Mô hình tạo hình ảnh chất lượng cao nhất từ trước đến nay của Google.

Mô hình này đã được đào tạo chuyên sâu và hiểu được ngôn ngữ tự nhiên, ý định đằng sau các gợi ý của người dùng, đồng thời kết hợp thêm các chi tiết để tạo ra hình ảnh đúng như yêu cầu của người dùng.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Nếu bạn được trải nghiệm tính năng này, Gemini Imagen 3 sẽ làm bạn ngạc nhiên với hình ảnh siêu chân thực, sống động như ảnh được chụp thực tế. Đồng thời mô hình này cũng gặp rất ít lỗi khi người dùng trải nghiệm. So với các mô hình tạo hình ảnh trước đây, công nghệ này là một bước tiến đáng khen của Google, trở thành công cụ tạo hình ảnh từ văn bản vượt trội nhất hiện nay.

Gemini Ask Photo

Google I/O 2024 đưa người xem từ bất ngờ này đến bất ngờ khác. Một tính năng thú vị ít ai có thể ngờ đến là Gemini Ask Photo – Công cụ hứa hẹn cách mạng hóa cách thức chúng ta tìm kiếm hình ảnh trên Google Photos. Đây chính là sự kết hợp tuyệt vời giữa mô hình Gemini và kho ảnh khổng lồ Google Photos, tạo nên công cụ tìm kiếm ảnh thông minh và nhanh chóng, hiệu quả.

– Tìm kiếm bằng câu lệnh ngôn ngữ tự nhiên

Với Gemini Ask Photo, bạn sẽ không cần nhớ chính xác từ khóa cần thiết để tìm kiếm hình ảnh. Người dùng hoàn toàn có thể sử dụng ngôn ngữ tự nhiên để mô tả bức ảnh mà bạn đang tìm kiếm, ví dụ “bức ảnh chụp tôi đi Ba vì năm 2023 cùng với gia đình”. Gemini Ask Photo sẽ hiểu yêu cầu đó và tìm kiếm, đưa ra kết quả phù hợp nhất để thỏa mãn người dùng.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

– Hiểu được bối cảnh và chi tiết

Có một điểm đặc biệt nữa là Gemini Ask Photo không chỉ tìm kiếm dựa trên nội dung ảnh mà còn hiểu thêm được bối cảnh và chi tiết liên quan. Ví dụ, bạn hỏi “Khi nào con trai tôi tập đi xe đạp?” và công cụ này sẽ tìm kiếm những hình ảnh chụp con trai của bạn đang tập đi xe đạp, đồng thời sẽ có cả ngày tháng chụp bức ảnh để người dùng có thể dễ dàng xác định được thời gian.

Hiện nay, tính năng Ask Photo vẫn đang được Google thử nghiệm và sắp tới sẽ triển khai cho người dùng. Nhờ đó, mọi người sẽ có thể quản lý kho ảnh của mình hiệu quả hơn.

Google AI Overview: Công nghệ AI tổng hợp thông tin

Google AI Overviews là gì?

Ngoài ra, một công cụ đặc biệt được ra mắt trong Google I/O 2024 đó là Google AI Overviews. Vậy Google AI Overviews là gì? Đây là tính năng được tích hợp vào công cụ tìm kiếm Google Search. Tính năng này sử dụng công nghệ AI để tổng hợp cũng như tóm tắt thông tin từ nhiều nguồn khác nhau, hỗ trợ người dùng có cái nhìn tổng quan, nắm bắt được các điểm chính về một chủ đề cụ thể mà không cần phải tự tìm hiểu và đọc nhiều thông tin từ các nguồn khác nhau.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Google AI Overviews hiện đã được triển khai cho người dùng tại Mỹ cũng như sẽ sớm được mở rộng sang các quốc gia, vùng lãnh thổ khác. Điều này cũng như minh chứng rõ ràng cho cam kết của Google trong việc ứng dụng nâng cấp cải tiến AI nhằm nâng cao trải nghiệm tìm kiếm và cải thiện khả năng mở rộng tổng hợp thông tin cho người dùng trên toàn thế giới.

Vậy AI Overviews có miễn phí không? Hiện tại, Google AI Overviews là tính năng được tích hợp trực tiếp vào công cụ tìm kiếm Google Search và hoàn toàn miễn phí sử dụng. Tuy nhiên, trong tương lai, Google có thể sẽ có những thay đổi về chính sách sử dụng hoặc tính phí đối với tính năng này. Bạn có thể theo dõi tin tức, thông báo từ Google qua trang Tin tức của GCSVN để cập nhật các thông tin mới nhất về AI Overviews.

Tính năng của Google AI Overviews

AI Overviews khác gì so với tìm kiếm thông thường? Google AI Overviews dù mới được ra mắt nhưng đã mang đến nhiều tính năng hữu ích nhằm mang đến cho người dùng trải nghiệm tìm kiếm thông tin tốt nhất:

Tính năng Mô tả
Tổng hợp các điểm nổi bật của thông tin cần tìm kiếm nhanh chóng AI Overviews tự động tổng hợp thông tin từ đa dạng các nguồn thông tin, kiểm duyệt mức độ uy tín rồi mới gửi cho người dùng những kết quả chính xác. Từ đó giúp mọi người có thể nắm bắt nội dung chính của chủ đề đó một cách nhanh nhất mà không cần đọc nhiều bài thông tin khác nhau
Trình bày thông tin rõ ràng, dễ hiểu Bản tóm tắt được tạo ra bởi Google AI Overviews được trình bày ngắn gọn, dễ hiểu, bố cục thông tin rõ ràng, mạch lạc, giúp người dùng tiếp thu thông tin dễ dàng hơn.
Cung cấp các liên kết nguồn tham khảo sau mỗi bài AI Overviews không chỉ cung cấp bản tóm tắt ngắn gọn, mà còn trích nguồn cũng như liên kết đến các nguồn uy tín mà công cụ này tìm được, hỗ trợ người dùng tìm hiểu sâu hơn nếu có thời gian nghiên cứu.
Hỗ trợ đa dạng các chủ đề khác nhau Google đã tạo lập tính năng Google AI Overviews có thể tổng hợp thông tin về đa dạng các lĩnh vực, chủ đề như khoa học, lịch sử, địa lý hay các chuyên ngành phổ biến như y tế, tài chính, truyền thông, công nghệ…
Tích hợp mạnh mẽ với công cụ tìm kiếm Google Search AI Overviews được nghiên cứu tích hợp trực tiếp vào Google Search, hỗ trợ người dùng có thể làm quen, tiếp cận nhanh chóng tính năng này.
Có khả năng học hỏi và cải thiện tốt hơn Vì là một công cụ mới, nên Google AI Overviews vẫn cần phải học hỏi và cải thiện tốt lên dựa trên AI, nâng cao khả năng tổng hợp và trình bày thông tin tốt hơn theo thời gian. Từ đó có thể đem đến trải nghiệm tốt hơn cho người dùng.
Tương tác với người dùng AI Overviews hỗ trợ người dùng đặt thêm các câu hỏi sâu hơn liên quan đến chủ đề cũng như cần thêm thông tin chi tiết.

Cách thức hoạt động của Google AI Overviews

Vậy AI Overviews sẽ thay đổi cách chúng ta tìm kiếm như thế nào? Để bạn hiểu rõ hơn về Google AI Overviews, GCS Vietnam sẽ nói thêm về cách thức hoạt động của công cụ này.

Khi bạn đặt câu hỏi hoặc tìm kiếm chủ đề trên Google Search, AI Overviews sẽ tự động phân tích các kết quả tìm kiếm phù hợp và tổng hợp thông tin từ nhiều nguồn uy tín, sau đó sẽ cho ra kết quả là một bản trình bày tóm tắt ngắn gọn và dễ hiểu về chủ đề mà bạn tìm kiếm. Bản tóm tắt này sẽ bao gồm các thông tin quan trọng nhất, các điểm nổi bật chính mà bạn cần lưu ý cũng như các liên kết đến các nguồn tham khảo chi tiết, đầy đủ hơn.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Tính năng mới ra mắt này đặc biệt hữu ích khi chúng ta cần tìm kiếm thông tin nhanh chóng về một chủ đề mới nhưng chưa có nhiều thời gian để đọc kỹ, nghiên cứu. Google AI Overviews sẽ tối ưu được thời gian và công sức cho người dùng khi muốn tóm tắt thông tin mới, đồng thời cũng cung cấp thông tin chính xác và đáng tin cậy nhờ khả năng phân tích và tổng hợp thông tin mạnh mẽ của AI.

AI Overviews có nhược điểm gì?

Mặc dù Google AI Overviews mang lại nhiều tiện ích cho người dùng, nhưng tính năng này vẫn còn tồn tại một số hạn chế mà người dùng cần lưu ý:

– Chủ quan trong việc lựa chọn thông tin

Như các công nghệ AI khác, AI Overviews dựa trên thuật toán để lựa chọn cũng như tổng hợp thông tin, do đó sẽ không thể tránh khỏi sự chủ quan trong việc quyết định những thông tin nào là phù hợp và quan trọng nhất để đưa vào bản tóm tắt. Tuy nhiên, công nghệ này vẫn đang trong quá trình phát triển nên khó tránh khỏi một số sai sót cần lưu ý.

– Khó tương tác, tùy chỉnh

AI Overviews cung cấp bản tóm tắt cố định, người dùng sẽ không thể tương tác hay yêu cầu thêm thông tin chi tiết về khía cạnh cụ thể nào. Vì vậy, hạn chế này sẽ là trở ngại khi người dùng muốn tìm hiểu sâu hơn về vấn đề đó.

– Khó khăn trong việc xử lý các chủ đề phức tạp

Đối với những chủ đề cần nhiều kiến thức chuyên sâu hay có những quan điểm khác nhau, AI Overviews sẽ khó xử lý hơn và bản tóm tắt cũng không đầy đủ, trực quan như thông thường. Bản tóm tắt có thể bị đơn giản quá mức, không đủ chiều sâu về khía cạnh vấn đề đó.

Công nghệ AI mới: Project Astra

Một trong những công bố nổi bật tại hội nghị lần này, Google ra mắt công nghệ mới Project Astra – một dự án đầy tham vọng của ông lớn Google nhằm phát triển thế hệ AI hoàn toàn mới, vượt xa tất cả những đối thủ AI hiện nay trên thị trường.

Dựa trên nền tảng trí tuệ nhân tạo Gemini AI, Project Astra hứa hẹn mang đến những trải nghiệm tương tác liền mạch hơn và hỗ trợ người dùng thực hiện các tác vụ phức tạp hơn.

Điểm nổi bật của Astra là khả năng xử lý thông tin đa phương thức, cho phép trợ lý AI có thể hiểu và phản hồi không chỉ qua văn bản mà còn có cả hình ảnh, âm thanh, video. Nhờ đó, người dùng có thể giao tiếp với trợ lý AI một cách tự nhiên và trực quan hơn.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Ví dụ, khi bạn hỏi Astra về một địa điểm, trợ lý AI này sẽ không chỉ đơn thuần cung cấp địa chỉ mà còn có thể gợi ý thêm về những nhà hàng ngon ở gần đó, chỉ đường đi hoặc thậm chí đặt chỗ giúp bạn.

Google cũng đã đưa ra hình ảnh minh họa cũng như trình diễn khả năng ấn tượng, đặc biệt của Project Astra tại hội nghị Google I/O 2024, như giải thích các hình vẽ phức tạo, nhận dạng địa danh nổi tiếng và ghi nhớ, thực hiện lại các chuỗi hành động.

Như vậy, trong tương lai, Project Astra sẽ có thể trở thành một trong những trợ lý AI không thể thiếu trong cuộc sống hàng ngày của mọi người, hỗ trợ trong công việc, học tập cũng như giải trí, khám phá thế giới xung quanh một cách hiệu quả hơn.

Ra mắt Veo: Sáng tạo Video AI

Tại buổi hội nghị Google I/O 2024, Google đã cho ra mắt ứng dụng công nghệ AI trong lĩnh vực sản xuất nội dung video – Veo AI.

Mô hình sáng tạo video bằng công nghệ AI mới của Google hỗ trợ sáng tạo các đoạn video chất lượng cao (tương đương độ phân giải 1080p) với phong cách chân thực, điện ảnh, sống động chỉ từ mô tả văn bản hoặc hình ảnh, video ví dụ.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

Veo AI sẽ tập trung các tính năng để tạo ra nội dung video liền mạch cũng như nhất quán, đồng thời mô phỏng gần như chính xác mượt mà những chuyển động của con người, động vật, thậm chí là vật thể trong suốt thời lượng video. Người dùng có thể tạo ra những video có độ dài lên tới 1 phút 10 giây cùng với những câu Prompt chi tiết, bổ sung để tạo được kết quả chất lượng cuối cùng.

Veo AI đã mở ra kỷ nguyên mới cho việc sản xuất video. Người dùng sẽ không cần phải có nhiều kiến thức chuyên sâu để có thể tạo ra những video chất lượng cao. Chỉ cần vài câu lệnh đơn giản, súc tích, đầy đủ nhu cầu, bạn sẽ có ngay video hoàn chỉnh, sống động trong nháy mắt.

VideoFX, Image FX và Music FX

Video FX

Công nghệ VideoFX sẽ tích hợp mô hình Veo AI hỗ trợ người dùng tùy chỉnh theo nhu cầu, nâng cao chất lượng video bằng cách sử dụng các hiệu ứng đặc biệt cũng như bộ lọc màu sắc ấn tượng. Trong đó còn bao gồm các công cụ chỉnh sửa chuyên nghiệp, giúp tạo ra các video độc đáo, gây ấn tượng với người xem, đáp ứng những tiêu chí, mong muốn phức tạp hơn của người dùng trong tương lai.

ImageFX

ImageFX cũng được nghiên cứu và thiết kế để kết hợp với Imagen 3 xử lý hình ảnh chất lượng cao, loại bỏ được độ nhiễu trong bức ảnh. Đây cũng chính là mô hình chuyển đổi văn bản thành hình ảnh mới và hiệu quả nhất của Google DeepMind.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

MusicFX

Nghe tên là chúng ta cũng có thể đoán được công cụ này hỗ trợ tính năng gì. Music FX là công cụ tạo và chỉnh sửa âm thanh dựa trên AI. Nó được nâng cấp thêm một tính năng mới là chế độ DJ, hỗ trợ người dùng tạo ra các âm beat chất lượng sống động, bằng cách kết hợp giữa các thể loại nhạc và nhạc cụ.

Gemma 2 – Bản nâng cấp với 27 tỷ tham số

Gemma là một họ của các mô hình mở được nghiên cứu và thiết kế bởi Google, sử dụng công nghệ tương tự để tạo ra các mô hình Gemini. Sự kiện Google I/O 2024 đã thông báo đến toàn thể người dùng về sự ra mắt của Gemma 2 – thế hệ kế tiếp của mô hình Gemma. Gemma 2 có kích thước mới, nhẹ hơn để thuận tiện cho nhiều trường hợp sử dụng, đặc biệt dành cho các nhà phát triển công nghệ AI. Nó cũng có cấu trúc hoàn toàn mới để đạt được hiệu suất và hiệu quả đột phá, có thể mang lại các lợi ích như:

– Hiệu suất cao

Với 27 tỷ tham số, Gemma 2 mang lại hiệu suất tương đương với Llama 3 70B – kích thước nhỏ hơn một nửa. Phát minh đột phá này đặt ra tiêu chuẩn mới trong lĩnh vực thiết kế mô hình mở.

– Giảm chi phí triển khai

Thiết kế hiệu quả của Gemma 2 với mô hình 27B được tối ưu hóa nhằm đáp ứng khả năng chạy hiệu quả trên GPU của NVIDIA hoặc trên máy chủ TPU duy nhất trong Vertex AI, giúp việc triển khai dễ tiếp cận hơn cũng như tối ưu chi phí cho doanh nghiệp.

Google I/O 2024 có gì mới? Sản phẩm AI nào sẽ được ra mắt?

– Đa dạng các công cụ tinh chỉnh

Hơn thế nữa, Gemma 2 cung cấp cho các nhà phát triển những tính năng cũng như công cụ đa dạng để tinh chỉnh mạng mẽ trên nhiều nền tảng khác nhau. Từ các giải pháp đám mây Google Cloud đến các công cụ cộng đồng như Axolotl, việc tinh chỉnh, thiết kế trên Gemma 2 sẽ dễ hơn bao giờ hết.

Lời kết

Trên đây là những thông tin, cập nhật mới nhất về các công nghệ nổi bật được Google giới thiệu trong sự kiện Google I/O 2024. Hãy theo dõi trang Tin tức GCS Vietnam mỗi ngày để biết thêm những thông báo của Google về các sản phẩm sắp tới ngay.

Ngoài ra, nếu quý doanh nghiệp mong muốn được tư vấn thêm về giải pháp AI của Google, hãy liên hệ ngay qua số Hotline: 024.9999.7777 để đội ngũ chuyên gia tại GCS hỗ trợ nhanh nhất.

 

5/5 - (1)
Bài viết liên quan
0 0 Các bình chọn
Đánh giá
Đăng ký
Thông báo của
guest

0 Bình luận
Cũ nhất
Mới nhất Nhiều bình chọn nhất
Phản hồi nội tuyến
Xem tất cả bình luận