Mô hình trí tuệ nhân tạo này được mở cho cộng đồng, khác với ChatGPT hay Claude, vốn là sản phẩm “đóng”. Apertus được công khai toàn bộ mã nguồn, dữ liệu huấn luyện, trọng số mô hình và cả quá trình phát triển. Tất cả đều có sẵn trên nền tảng Hugging Face để ai cũng có thể tải về, nghiên cứu hoặc phát triển thêm.
Tên gọi Apertus xuất phát từ tiếng Latinh, nghĩa là “mở”, theo đúng tinh thần minh bạch mà nhóm phát triển theo đuổi. Mô hình này được huấn luyện trên dữ liệu từ hơn 1.800 ngôn ngữ khác nhau, nên có thể coi là một trong những mô hình AI toàn cầu nhất hiện nay. Hiện tại, Apertus có hai phiên bản: một bản nhỏ với 8 tỷ tham số và một bản lớn hơn đến 70 tỷ tham số, ngang tầm với Llama 3 của Meta ra mắt năm 2024.
Điểm đáng chú ý là quá trình thu thập dữ liệu của Apertus được thực hiện một cách có đạo đức và đúng luật. Nhóm phát triển chỉ dùng dữ liệu từ các nguồn công khai, tuân thủ quy định bản quyền của Liên minh châu Âu và tôn trọng cả những website từ chối cho phép AI “thu thập” thông tin. Sự ra đời của Apertus mang lại một lựa chọn minh bạch và cơ hội tiếp cận công nghệ cho các nhà nghiên cứu, trường đại học hay những công ty nhỏ
Nguồn: The Verge
Nguồn:Baochinhphu.vn