Các nhà nghiên cứu của Apple đã phát triển một phương pháp mới giúp LLMs tạo văn bản nhanh hơn tới 5 lần mà vẫn duy trì chất lượng đầu ra. Kỹ thuật này được gọi là “multi-token prediction”, cho phép mô hình dự đoán nhiều token (từ hoặc ký tự) cùng lúc, thay vì từng token một như cách tiếp cận truyền thống.
Phương pháp này đặc biệt hiệu quả trong các tác vụ liên quan đến toán học và lập trình, nơi LLMs thường phải xử lý chuỗi dữ liệu phức tạp. Nghiên cứu được công bố vào tháng 7/2025. Nghiên cứu được công khai, cho thấy Apple đang chia sẻ những phát hiện này với cộng đồng công nghệ, có thể thúc đẩy sự phát triển của các LLM khác.
Thông thường, LLMs dự đoán từng token một, dẫn đến tốc độ chậm và tốn tài nguyên tính toán. Kỹ thuật mới của Apple giúp mô hình dự đoán nhiều token cùng lúc, giảm đáng kể thời gian xử lý mà không làm giảm độ chính xác. Việc áp dụng kỹ thuật này có thể cải thiện đáng kể hiệu suất của Siri, Apple Intelligence, hoặc các ứng dụng AI khác trên iPhone, Mac và iPad, mang lại trải nghiệm mượt mà hơn cho người dùng, đặc biệt trong các tác vụ đòi hỏi phản hồi nhanh như lập trình hoặc phân tích dữ liệu.
Apple đang nỗ lực bắt kịp các đối thủ trong lĩnh vực AI, nơi tốc độ và hiệu quả là yếu tố then chốt. Kỹ thuật này có thể giúp Apple củng cố vị thế trong cuộc đua AI, đặc biệt khi cạnh tranh với các mô hình như GPT của OpenAI hay Google Gemini. Dẫu vậy, người dùng vẫn đang chờ Siri cá nhân hóa và bộ tính năng Apple Intelligence thực sự hữu ích hơn, trước khi nghĩ đến bất kì một sự nâng cấp nào từ Apple.
Nguồn:Baochinhphu.vn