Chúc Mừng
Open Assistant Đã Hoàn Thành!

Cộng đồng đã cùng nhau xây dựng một dự án mã nguồn mở ấn tượng về mô hình ngôn ngữ lớn. Cùng nhìn lại hành trình này.

🔓Mô hình ngôn ngữ mã nguồn mở
📚Bộ dữ liệu Oasst2 có sẵn

Tổng Quan Open Assistant Là Gì?

Open Assistant là một dự án đầy tham vọng nhằm cung cấp cho mọi người quyền truy cập vào một mô hình ngôn ngữ lớn dựa trên chat. Mục tiêu là tạo ra một cuộc cách mạng trong lĩnh vực ngôn ngữ, tương tự như cách Stable Diffusion đã giúp thế giới tạo ra những hình ảnh và tác phẩm nghệ thuật mới.

Dự án tin rằng việc cải thiện ngôn ngữ sẽ giúp cải thiện thế giới. Dù đã hoàn thành, những bài học và dữ liệu thu thập được sẽ tiếp tục đóng góp vào sự phát triển của các dự án tương tự.

Kết Nối Liên Kết Hữu Ích

Để tìm hiểu thêm và khám phá các tài nguyên liên quan đến Open Assistant, bạn có thể tham khảo các liên kết sau:

- Bộ dữ liệu Oasst2 trên HuggingFace: [OpenAssistant/oasst2](liên kết)

- Trang thu thập dữ liệu (đã hoàn thành): [liên kết]

- Tài liệu dự án chat: [liên kết]

Tầm Nhìn Hướng Tới Tương Lai

Open Assistant không chỉ dừng lại ở việc sao chép ChatGPT. Mục tiêu là xây dựng một trợ lý ảo của tương lai, có khả năng không chỉ viết email và thư xin việc mà còn thực hiện các công việc có ý nghĩa, sử dụng API, nghiên cứu thông tin động và hơn thế nữa. Hơn nữa, trợ lý này có thể được cá nhân hóa và mở rộng bởi bất kỳ ai.

Dự án mong muốn thực hiện điều này một cách mở và dễ tiếp cận, có nghĩa là không chỉ xây dựng một trợ lý ảo tuyệt vời mà còn làm cho nó đủ nhỏ và hiệu quả để chạy trên phần cứng tiêu dùng.

Open source is the belief that if we collaborate we can together gift our knowledge and technology to the world for the benefit of humanity.

Open Assistant Community

Tìm Hiểu Thêm

Khám phá các tài liệu và liên kết hữu ích.

📰

Blog Open Assistant

Đọc bài viết tổng kết dự án và những bài học kinh nghiệm.

⬇️

Hugging Face Oasst2

Tải xuống và khám phá bộ dữ liệu Oasst2.

Kế Hoạch Các Bước Triển Khai

Dự án đã tiến hành theo ba bước chính, dựa trên phương pháp InstructGPT:

1. Thu thập các mẫu Instruction-Fulfillment (prompt + response) chất lượng cao do con người tạo ra (mục tiêu > 50k).

2. Xếp hạng các phản hồi của mô hình dựa trên đánh giá của cộng đồng để huấn luyện mô hình phần thưởng.

3. Đào tạo RLHF dựa trên các prompt và mô hình phần thưởng.