Vào ngày thứ Năm, trong một thông cáo báo chí, Tập đoàn Alibaba cho biết họ đã “ra mắt” mã nguồn của hai mô hình ngôn ngữ lớn (LLM), một loại mô hình AI, có tên là Qwen-7B và Qwen-7B-Chat. Mỗi mô hình có 7 tỷ tham số (đơn vị thường được sử dụng để đo sức mạnh của mô hình AI).

Trước đó vào tháng Tư, Alibaba Cloud đã công bố LLM có tên Tongyi Qianwenđi với nhiều phiên bản có lượng tham số khác nhau. Alibaba cho biết Qwen-7B và Qwen-7B-Chat là hai phiên bản cỡ nhỏ của Tongyi Qiawen, nhằm mục đích hỗ trợ các doanh nghiệp vừa và nhỏ bắt đầu sử dụng AI.

Sự kiện này đánh dấu lần đầu tiên một công ty công nghệ lớn của Trung Quốc có LLM mã nguồn mở của riêng mình.

Thông báo của công ty cũng cho biết các học giả, nhà nghiên cứu và tổ chức thương mại trên toàn thế giới sẽ được truy cập miễn phí mã nguồn, trọng số mô hình và tài liệu của cả hai LLM.

Tuy nhiên, đối với các công ty có hơn 100 triệu người dùng hoạt động hàng tháng, họ sẽ cần xin giấy phép từ Alibaba trước khi sử dụng hai mô hình. Tương tự, Llama 2 của Meta cũng yêu cầu giấy phép từ các khách hàng có hơn 700 triệu người dùng.

Tập đoàn Alibaba
Tập đoàn Alibaba

Sự phát triển này diễn ra sau khi Meta phát hành LLM nguồn mở Llama 2 với Microsoft vào ngày 16 tháng 7.

Meta cho biết Llama 2 của họ đã được đào tạo bằng cách sử dụng thêm 40% dữ liệu công khai và có thể xử lý ngữ cảnh gấp đôi so với người tiền nhiệm của nó. Nó cũng là mã nguồn mở, với phiên bản lớn nhất của Llama 2 có 70 tỷ thông số.

Trung Quốc đang cố gắng bắt kịp Mỹ trong lĩnh vực AI, khi khuyến khích các công ty trong nước nhanh chóng phát triển các mô hình AI có thể cạnh tranh với sản phẩm do các công ty Mỹ phát triển.

Ngoài Alibaba, những “gã khổng lồ” công nghệ Trung Quốc khác như Tencent Holdings và Huawei cũng tích cực phát triển các mô hình AI của riêng họ trong những tháng gần đây.