GPTViet – Mô hình ngôn ngữ lớn nguồn mở cho tiếng Việt (CĐS012)

Hình ảnh minh họa.
GPTViet là mô hình ngôn ngữ lớn (Large Language Model – LLM) mang tính nền tảng, được phát triển theo định hướng nguồn mở nhằm xây dựng và thúc đẩy hệ sinh thái trí tuệ nhân tạo dành cho tiếng Việt. Nền tảng hướng tới hỗ trợ nhiều bài toán xử lý ngôn ngữ tự nhiên như tạo sinh nội dung, hỏi đáp thông minh, trợ lý ảo, phân tích dữ liệu văn bản, tìm kiếm tri thức và phát triển các ứng dụng AI phục vụ quản lý, giáo dục, doanh nghiệp và chuyển đổi số.
Hệ thống được xây dựng trên kiến trúc mô hình ngôn ngữ lớn hiện đại, tập trung tối ưu cho tiếng Việt và định hướng phát triển thành nền tảng AI đa phương thức (multimodal), cho phép xử lý và tích hợp nhiều dạng dữ liệu khác nhau như văn bản, âm thanh, hình ảnh và video. Việc phát triển theo nguyên tắc nguồn mở tạo điều kiện để cộng đồng nghiên cứu, doanh nghiệp và các tổ chức công nghệ cùng tham gia phát triển, mở rộng và ứng dụng.
Điểm mới và tính độc đáo của GPTViet nằm ở định hướng xây dựng một mô hình ngôn ngữ lớn nguồn mở chuyên biệt cho tiếng Việt, hướng tới làm chủ công nghệ lõi AI trong nước và phát triển hệ sinh thái trí tuệ nhân tạo mang bản sắc Việt Nam. Khác với các mô hình phụ thuộc vào nền tảng nước ngoài, GPTViet được định hướng trở thành hạ tầng AI mở, cho phép tùy biến, huấn luyện và tích hợp linh hoạt cho các nhu cầu ứng dụng trong nước. Tính mở của nền tảng giúp mở rộng khả năng hợp tác giữa cộng đồng nghiên cứu, doanh nghiệp và nhà phát triển, đồng thời tạo tiền đề xây dựng hệ sinh thái AI đa diện, đa phương thức và thúc đẩy chủ quyền số quốc gia.