Google Gemini: Bước Tiến Đột Phá Về AI ‘mạnh hơn GPT-4’

Google Gemini: Bước Tiến Đột Phá Về AI ‘mạnh hơn GPT-4’

Google Gemini là thành tựu đáng kể trong lĩnh vực trí tuệ nhân tạo, hội tụ kiến thức từ 57 lĩnh vực khác nhau để giải quyết các thách thức phức tạp, đánh dấu bước tiến đầu tiên của AI vượt qua khả năng của con người ở mức chuyên gia.

Ra mắt vào ngày 6/12, Gemini không chỉ là một mô hình AI tiên tiến mà còn là sự hiện thân của sự tiến bộ và tích hợp của Google. Nó thách thức GPT-4 của OpenAI với sự toàn diện và tiên tiến.

Điểm độc đáo của Gemini là cách nó được xây dựng theo hướng đa phương thức, khả năng tổng hợp và tương tác với nhiều loại thông tin khác nhau, bao gồm văn bản, mã nguồn, âm thanh, hình ảnh và video.

Để đáp ứng đa dạng nhu cầu sử dụng từ các trung tâm dữ liệu đến thiết bị di động, Google đã thông báo rằng Gemini 1.0 sẽ được cung cấp dưới ba biến thể kích cỡ khác nhau: Gemini Ultra, Gemini Pro và Gemini Nano. Trong số này, Gemini Ultra nổi bật với kích thước lớn và sức mạnh đỉnh cao.

Tương quan ba phiên bản kích thước của mô hình AI Gemini. Ảnh: Google
Tương quan ba phiên bản kích thước của mô hình AI Gemini. Ảnh: Google

Kết quả thử nghiệm từ Google cho thấy rằng Gemini Ultra đã đạt được điểm 90% trong bài kiểm tra Khả năng Hiểu Ngôn Ngữ Đa Nhiệm Lớn (MMLU), đánh dấu sự xuất sắc trong việc hiểu biết ngôn ngữ trong bối cảnh nhiều nhiệm vụ. Mô hình này sử dụng kiến thức từ 57 môn học khác nhau như toán, vật lý, lịch sử, luật, y học và đạo đức để đánh giá cả kiến thức thế giới và khả năng giải quyết vấn đề, đồng thời có thể “sử dụng khả năng của mình để nghĩ kỹ hơn trước khi trả lời những câu hỏi khó”.

Đọc thêm  Chuyện tình cách biệt âm dương với Đình Duy: Bị "đòi lại nước mắt", Lan Anh lên tiếng

Với kết quả này, Gemini trở thành trí tuệ nhân tạo đầu tiên vượt qua con người ở cấp độ chuyên gia, với điểm 89,8% trong bài kiểm tra tương tự. So với đó, GPT-4 đạt 87%, LLAMA-2 đạt 68%, và Claude 2 của Anthropic đạt 78,5%.

Phiên bản mạnh nhất của Gemini cũng vượt qua 30 trong số 32 tiêu chuẩn trong nghiên cứu và phát triển mô hình ngôn ngữ lớn, đạt điểm 59,4% về khả năng Hiểu Biết Lớn về Đa Phương Thức (MMMU), bao gồm các nhiệm vụ đa phương thức trải rộng trên các lĩnh vực khác nhau đòi hỏi suy luận có chủ ý.

Demis Hassabis, CEO Google DeepMind và đại diện của Đội Gemini, cho biết công ty mong muốn xây dựng thế hệ mô hình trí tuệ nhân tạo mới lấy cảm hứng từ phương thức nhận biết và tương tác với thế giới của con người. Nhờ đó, AI không chỉ dừng lại như một phần mềm thông minh mà còn trở nên hữu ích và trực quan hơn, tương tự như một cộng sự cho người dùng.

“Hôm nay, chúng tôi tiến thêm một bước gần hơn đến viễn cảnh này bằng việc giới thiệu Gemini, mô hình trí tuệ nhân tạo tiên tiến và tổng quát nhất từng được Google phát triển”, Hassabis nói.

Ngoài hiệu suất mạnh mẽ, Google cho biết Gemini 1.0 được đào tạo để nhận diện văn bản, hình ảnh, âm thanh cùng nhiều loại hình khác ngay cùng một thời điểm, giúp nó hiểu rõ hơn thông tin có sắc thái và trả lời các câu hỏi liên quan đến những chủ đề phức tạp. Mô hình này cũng có khả năng giải thích và viết mã bằng những ngôn ngữ lập trình phổ biến hiện nay như Python, Java, C++, và Golang.

Minh hoạ về các dạng thông tin mà Gemini có thể xử lý, như: chữ viết, ảnh, âm thanh, video. Ảnh: Google
Minh họa về các dạng thông tin mà Gemini có thể xử lý, như: chữ viết, ảnh, âm thanh, video. Ảnh: Google

heo Google, những đặc tính này giúp Gemini có khả năng đọc và hiểu, trích xuất thông tin từ hàng trăm nghìn tài liệu, mở ra tiềm năng tạo ra đột phá mới trong nhiều lĩnh vực, từ khoa học đến tài chính, trong khoảng thời gian ngắn.

Đọc thêm  Người ta thường hối tiếc về 9 điều này sau 10 năm trải đời

Trong sự kiện ra mắt, Google thông báo rằng phiên bản Ultra của Gemini là phiên bản được thiết kế cho các tác vụ phức tạp nhất và đang trong quá trình kiểm tra độ an toàn trước khi được tung ra chính thức. Gemini Nano là phiên bản dành cho các tác vụ thực hiện trên thiết bị di động và sẽ được tích hợp trên Pixel 8 Pro. Khi đó, điện thoại sẽ được bổ sung thêm nhiều khả năng, bao gồm tóm tắt nội dung ghi âm và khả năng trả lời thông minh trên bàn phím Gboard. Cả hai phiên bản Gemini này dự kiến sẽ ra mắt vào năm sau.

Đối với bản Pro, nó hiện đang được tích hợp vào chatbot Bard. Người dùng có thể trải nghiệm các cải tiến thông qua một số yêu cầu liên quan đến đọc hiểu, tóm tắt, lý luận, lập trình và lập kế hoạch.

Đây cũng là bản nâng cấp lớn nhất của Bard kể từ khi ra mắt. Tuy nhiên, hiện tại Bard sử dụng Gemini Pro chỉ hỗ trợ tiếng Anh và có thể sử dụng ở 180 quốc gia và vùng lãnh thổ. Google đã thông báo kế hoạch mở rộng hỗ trợ ngôn ngữ cho Bard trong thời gian sắp tới. Vào năm sau, Bard sẽ được nâng cấp để sử dụng phiên bản mạnh mẽ nhất của Gemini Ultra.

Thể loại

Bình luận