ChatGPT tạo ra các câu hỏi tự luận thường mang tính phân tích cao, chẳng hạn “Nhận xét về vai trò của Mỹ trong quan hệ quốc tế thời kì Chiến tranh lạnh. Theo bạn, tác động của chính sách đối ngoại này là tích cực hay tiêu cực? Giải thích ngắn gọn.” Cách đặt câu hỏi này khá hay, gợi ý phân tích rất nhiều. Tuy nhiên có thể khẳng định, các nội dung này được tạo ra dựa trên chính kiến thức mà model đã được train nhiều hơn là nội dung đọc từ sách. Dễ nhận biết vì trong sách bản mình tải lên, họ ghi là “nước Mĩ” nhưng trong toàn bộ các câu hỏi đều là “nước Mỹ”, đồng thời đọc kỹ thì các câu hỏi có nội dung cũng không thực sự bám sát tài liệu.
Điều này dễ hiểu và thể hiện rõ điểm yếu của ChatGPT ở khả năng xử lý file scan. Mặt khác, trước đây mình tải thử vài cuốn sách dài lên tới cả ngàn trang, khả năng xử lý của ChatGPT sẽ đôi khi rất kém ổn định đối với những tài liệu dài thế này.
Gemini đã đọc được nội dung của file PDF tải lên, thể hiện rõ bằng các cụm từ “nước Mĩ” đặc trưng của tài liệu. Các câu hỏi được bám sát vào nội dung của tài liệu, thậm chí ở từng đáp án của câu trắc nghiệm còn có dẫn cả vị trí trích nguồn trong sách giáo khoa. Tổng thể các câu hỏi của đề kiểm tra này rất ổn.
Ở điểm này Gemini bộc lộ điểm mạnh của việc nhận diện text và nội dung từ file đa phương tiện, một thế mạnh mà Google họ theo đuổi từ khi thiết kế model AI. Trước giờ, mình đã thử file PDF nội dung rất dài với Gemini thì nhờ cửa sổ ngữ cảnh lớn, do đó file PDF được xử lý ổn định, chất lượng các câu trả lời của nó cũng ổn định và giữ được chất lượng hơn khi các cuộc hội thoại kéo dài. Tuy nhiên, hay cũng có dở. Các câu hỏi của Gemini đưa ra quá an toàn, bao gồm cả các câu hỏi tự luận, trong khi câu hỏi của ChatGPT thì có chất lượng sư phạm có thể nói là hiệu quả hơn.
Kết luận nhanh ở đây thì mặc dù có khả năng suy luận tốt, ngôn ngữ tự nhiên nhưng ChatGPT không xử lý được file scan người dùng tải lên, dẫn tới việc không đủ data để soạn nội dung đúng ý đồ của người dùng. Ở trường hợp này Gemini thắng toàn tập do đọc được nội dung người dùng đưa ra, hoàn thành tốt nhiệm vụ được đặt ra ban đầu là soạn đề.
Test khả năng hỗ trợ nhiều định dạng và ngôn ngữ
Mình thử tải lên một sơ đồ vòng tuần hoàn của nước trong tự nhiên, sau đó yêu cầu AI:
1. Giải thích sơ đồ này bằng tiếng Việt.
2. Liên hệ với thí dụ minh họa hiện tượng gần nhất xảy ra ở Việt Nam.
3. Sau đó, tạo ba câu hỏi trắc nghiệm bằng tiếng Anh dựa trên sơ đồ.
ChatGPT thể hiện khả năng phân tích hình ảnh của GPT-4 rất tốt. Nó có thể xác định chính xác các giai đoạn bay hơi, ngưng tụ, mưa,… và giải thích chúng một cách rõ ràng bằng tiếng Việt. Việc chuyển đổi sang tạo câu hỏi tiếng Anh cũng rất mượt mà. Tuy nhiên, tốc độ phản hồi có vẻ chậm hơn chút và đồng thời, yêu cầu liên hệ với thí dụ ở Việt Nam (đòi hỏi nó tự đi kiếm thêm nguồn địa phương) vẫn chưa ngon lắm.
Ở task này thí đối với Gemini, đây là thế mạnh tuyệt đối của Gemini. Được xây dựng cho đa phương thức, nó nhận dạng và phân tích hình ảnh gần như ngay lập tức. Lời giải thích chính xác. Khả năng dịch thuật và tạo câu hỏi bằng các ngôn ngữ khác nhau của Google cũng là một lợi thế lớn. Đặc biệt hơn, yêu cầu đi tìm thông tin mang tính địa phương được Gemini làm tốt hơn ở task này.
Tạm kết ở đây thì mặt bằng chung cả 2 đều thể hiện rất tốt, Gemini có phần nhỉnh hơn ở tốc độ nhận diện hình ảnh và trả về các thông tin mang tính địa phương.
Test giao diện, tốc độ và khả năng ứng dụng vào workflow làm việc / học tập
Yêu cầu: “Tôi đang viết một bài luận về Ảnh hưởng của biến đổi khí hậu đến Đồng bằng sông Cửu Long. Hãy tìm cho tôi 5 nguồn tài liệu học thuật uy tín gần nhất, tóm tắt ý chính của mỗi nguồn và soạn một dàn ý chi tiết cho bài luận của tôi trong một tài liệu Google Docs.”
ChatGPT có thể sử dụng chế độ duyệt web để tìm các bài báo, có thể do cơ chế được thiết kế nên ChatGPT chủ yếu lấy các nguồn từ những nghine cứu được công bố trên các trang ở nước ngoài. Về nội dung thì dàn ý nó tạo ra có cấu trúc logic rất chặt chẽ, có thể bắt tay vào chỉnh sửa và sử dụng tiếp trong workflow làm việc.
Tuy nhiên, yêu cầu nó tạo file để đi chỗ khác viết tiếp thì chưa được. Chúng ta buộc phải mở canvas của ChatGPT lên để xài. Còn đối với bạn nào đã quen với flow chuyển sang Google Docs hay Word 365 để hoàn thiện thì ChatGPT sẽ chưa tự tạo được dù đã cấp quyền cho vào Google Drive hay OneDrive. Điều này dẫn tới việc flow làm việc sẽ gián đoạn chút, cần phải đi xử lý thủ công.
Do Gemini được tích hợp trực tiếp với Google Workspace nên nó không chỉ xuất ngay dàn ý ra Google Docs để chúng ta edit tiếp mà nó còn có thể tận dụng những thứ khác trong hệ sinh thái Google, thí dụ như Gemini có thể tìm kiếm thông tin qua Google Scholar, tóm tắt chúng và sau đó trực tiếp tạo một file Google Docs với dàn ý đã được soạn sẵn. Lúc này mình chỉ cần xong phiên làm việc với Gemini ở cửa sổ này, qua bên Google Docs phát triển tiếp nội dung. Nếu cần có thể hỏi Gemini ngay bên kia luôn cho nhưng yêu cầu lặt vặt khác.
Về các nguồn và tính cập nhật, mình thấy Google lấy nguồn địa phương khá nhiều, đồng thời cũng vừa hồng vừa chuyên (có thể do cách họ đánh giá đâu là nguồn tin cậy), thời gian của các báo cáo cũng khá cập nhật.
Chỗ này thì mình thấy cả 2 như nhau, tùy vào mảng mà bạn cần nghiên cứu tìm hiểu mà báo cáo địa phương hay báo cáo nước ngoài sẽ mang lại giá trị. Đồng thời nếu quan trọng workflow làm việc liền mạch thì có thể sẽ thích Gemini hơn chút.
Test độ chính xác và khả năng Fact-Checking
Mình thử đặt ra yêu cầu để kiểm tra thông tin thời sự tính đến tháng 9 năm 2025: “Thủ tướng của Nhật Bản hiện tại là ai và chính sách kinh tế nổi bật nhất của ông ấy gần đây là gì?”
Có thể thấy ChatGPT nếu sử dụng chế độ duyệt web, nó có thể tìm thấy câu trả lời với độ chính xác cao, sử dụng các nguồn thể hiện khá rõ bản chất định hướng chính sách, dẫn các nguồn với tính cập nhật cũng khá ổn. Trong một số những tình huống khác, nếu yêu của bạn không đủ để ChatGPT kích hoạt tìm kiếm bằng duyệt web thì câu trả lời sẽ dựa trên dữ liệu huấn luyện cuối cùng của nó và chắc chắn sẽ sai. Người dùng phải chủ động kích hoạt tính năng duyệt web.
Đối với Gemini, do bản chất nó được kết nối trực tiếp với Google Search, Gemini sẽ cung cấp câu trả lời chính xác và cập nhật gần như ngay lập tức. Nó cũng có thể hiển thị các liên kết nguồn để người dùng tự kiểm chứng nên không có tình huống sẽ bị lấn cấn coi có duyệt web hay không. Suy cho cùng, câu trả lời của những thông tin mang tính cập nhật thì Google vẫn sẽ cho kết quả ổn hơn.
Tạm kết ở chỗ này, Gemini vượt trội trong việc cung cấp thông tin chính xác, cập nhật và có thể kiểm chứng, một yếu tố cực kỳ quan trọng trong học tập và nghiên cứu đối với sinh viên, người tìm hiểu thông tin.
Qua các khía cạnh trên về mặt hoạt động, rõ ràng mỗi “con AI” ChatGPT hay Gemini sẽ phù hợp với từng tác vụ, từng lĩnh vực riêng. Bài viết này khảo sát qua từng khía cạnh công nghệ của mỗi chatbot dành cho người dùng phổ thông phổ quát, học sinh sinh viên với nhu cầu tra cứu nhanh, hỗ trợ bài tập hàng ngày, tìm kiếm thông thông tin cập nhật, sử dụng các ứng dụng văn phòng thì rõ ràng, Gemni miễn phí mạnh mẽ hơn, đặc biệt là ai đang dùng sâu vào hệ sinh thái Google. Nếu chia theo kiểu đi sâu vào từng mảng, thí dụ ngành kỹ thuật tự nhiên, xã hội nhân văn, nghiên cứu, lập trình,… sẽ có những tác vụ cụ thể tương ứng với các nhu cầu đó, hẹn các bạn ở bài test khác nha. Chúc vui vẻ.
Nguồn:Baochinhphu.vn