Chủ đề hot nhất mạng xã hội hiện nay là ChatGPT, vậy thực hư ChatGPT là gì? Nó có phải chỉ đơn thuần là một con chat bot như rất nhiều con chat bot đã được tung ra thị trường trước đây không?
Mình sẽ làm rõ những điều này trong bài viết sau.
Table of Contents
ChatGPT là gì? Ý là thực sự là gì?
ChatGPT là một Large Language Model (LLM – mô hình ngôn ngữ “bự”) được huấn luyện để thực hiện một công việc cụ thể đó là “chat” hay đưa ra một cuộc hội thoại. Điểm khác biệt ở đây là mục đích của ChatGPT rất cụ thể và nó được hiệu chỉnh 1 cách có mục đích để bạn có thể dễ dàng ra lệnh và tạo ra một đoạn hội thoại với nó, như một chatbot. Vì có cách sử dụng khá trực quan nên nó được ưa dùng hơn hẳn các model ra đời trước nó như GPT-3 hay là BLOOM, vì những model này đều phục vụ nhiều mục đích chung và không cụ thể trực quan như ChatGPT.
Large Language Model
Thôi xong, nếu giải thích kiểu này thì cũng vẫn còn khó hiểu vì chúng ta vẫn còn một điểm mù, thế mô hình ngôn ngữ cỡ “bự” (LLM) là cái gì???
Hiện tại cách định nghĩa LLM và cách hiểu khá trực quan, chỉ đơn giản là các mô hình LLM thường là các model được huấn luyện (train) trên rất nhiều dữ liệu, và có rất nhiều parameters (có thể tạm hiểu như là nhiều neuron như não – mặc dù không chính xác lắm). Vì được train với nhiều data và có rất nhiều parameter nên các mô hình này không chạy được trong máy tính của bạn mà phải chạy trên 1 server lớn, và có dung lượng cũng rất lớn nữa.
Để có được cái tên “large” này vậy thì chắc hẳn phải tồn tại mô hình ngôn ngữ cỡ nhỏ chứ nhỉ? Đúng như vậy, LLM không phải là mô hình ngôn ngữ duy nhất được ứng dụng rộng rãi. Các thuật toán search và recommendation trong các feature search trong điện thoại, search trong app thường cũng có ứng dụng mô hình ngôn ngữ với ít data và chạy được trực tiếp trên điện thoại, chúng ta có thể gọi các mô hình này là cỡ nhỏ.
Như vậy LLM không phải là lần đầu tiên chúng ta ứng dụng language model vì chúng đã được ứng dụng từ trước cho các mục đích khác. Tuy nhiên ChatGPT có lẽ là language model được công chúng chú ý và sử dụng rộng rãi, với tốc độ tăng trưởng người dùng khủng khiếp nhất từ trước tới nay.
ChatGPT nó hoạt động làm sao?
ChatGPT và các mô hình ngôn ngữ “họ” GPT là mô hình ngôn ngữ xây dựng trên cấu trúc Transformer (không phải Transformer của Michael Bay). Các mô hình ngôn ngữ “họ” GPT thường có cách hoạt động khá đơn giản, đó chính là điền vào chỗ trống cho tới khi gặp “điều kiện dừng”.
Ví dụ như sau : (GPT có thể sẽ không làm y như vậy, đây chỉ là ví dụ minh hoạ)
Có mô hình GPT-3 trained trên vài TB dữ liệu, chúng ta có thể input vào 1 đoạn text (mà họ hay gọi là prompt), điều kiện dừng là dấu chấm hỏi.
Prompt: Tôi là một Data engineer —input vào GPT –output điền phần còn lại– rất năng nổ và làm được việc nhưng sao lương không cao? —gặp điều kiện dừng—-
Trong ví dụ trên, GPT-3 điền tiếp vào câu văn, cho đến khi nào đụng điều kiện dừng là dấu chấm hỏi thì sẽ ngừng output. Phần được thêm vào là phần in đậm.
Tương tự như vậy, ChatGPT cũng đơn thuần là hoàn thành phần còn lại của văn bản, nhưng OpenAI đã xây dựng một UI mà bạn có thể có cảm giác như là mình đang nói chuyện trực tiếp với ChatGPT vậy. Họ đã set một điều kiện dừng là một token ẩn nào đó và train dữ liệu trên rất nhiều văn bản hội thoại (các bạn có thể tìm hiểu thêm về các train trên mạng). Tuy nhiên về mặt ý tưởng và cách vận hành thì tương tự như vậy.
ChatGPT nó có…ý thức không?
Đấy là một câu hỏi hóc búa không phải bởi vì chúng ta có biết ChatGPT có ý thức không, mà điểm hóc búa ở định nghĩa của “ý thức”.
Vì mình không phải là chuyên gia về neuro science hay nhà triết gia gì đấy, nên mình cũng không thực sự hiểu “ý thức”(ý thức trong consciousness ấy chứ không phải trong nuôi chó đánh người) là gì. Nên mình không kết luận được liệu ChatGPT có ý thức không.
Để hiểu rõ điều này, chắc có lẽ cần một định nghĩa cụ thể về ý thức, và rất có thể các nhà triết gia thông thái có thể cho chúng ta biết định nghĩa của ý thức trong tương lai (hoặc có thể thử hỏi ChatGPT xem ý thức là gì).
ChatGPT có …trí tuệ không?
Nếu chúng ta chỉ coi một thứ gì đó có trí tuệ khi nó có ý thức thì có lẽ không, nhưng nếu xét về khía cạnh khả năng và bài test thì mình nghĩ là có.
Chúng ta có thể lấy vài bài đánh giá tri thức và trí tuệ ra (ví dụ như bài thi đại học, GMAT, MBA, etc…) cho ChatGPT làm, thì ChatGPT cũng sẽ đạt được một điểm số nhất định. Cá nhân mình cũng đã thử yêu cầu ChatGPT làm nhiều tác vụ phức tạp (mình dùng ChatGPT để build một con bot khác 🗿) thì ChatGPT làm đạt yêu cầu trong đa số trường hợp. Tất nhiên là không hoàn hảo, tuy nhiên giỏi hơn không biết code rất rất nhiều lần rồi.
Có trí tuệ hay không thì mình không dám kết luận, nhưng ChatGPT chắc chắn có thể thực hiện được các task yêu cầu trí tuệ.
ChatGPT có …trí nhớ không?
Trước đây mình có dùng api của GPT-3, ngoài ra có đọc một số blog post của engineer về ChatGPT mình có thể khẳng định ChatGPT hiện tại không có “trí nhớ thực”.
Trí nhớ thực là sao? Tức là khi bạn chat với ChatGPT nó sẽ được tiếp tục train và nhớ phần tiếp theo của hội thoại. Hiện tại ChatGPT không hoạt động như thế này mà dùng một cách khác là tự feed lại đoạn chat trước. Đại khái là server của OpenAI sẽ tự nhắc cho ChatGPT biết là bạn và ChatGPT đã nói chuyện gì trước đó (tự feed lại prompt cho tới khoảng 4000 tokens- tokens giống như số kí tự limit vậy).
Cho nên bạn hiện tại có thể chửi ChatGPT thoả thích vì nó không thực sự nhớ tên và số nhà của bạn và hỏi bạn biết bố nó là ai đâu (là Sam Altman đó).
Dùng ChatGPT ở đâu?
ChatGPT có thể truy cập được ở link dưới đây
Có một lưu ý là để vào được link này bạn cần có VPN vì hiện tại Việt Nam chưa được hỗ trợ. Cách đăng kí thì bạn cần có một email, và một số điện thoại ở nước mà OpenAI có support (ví dụ như Singapore đi chẳng hạn). Bạn có thể nhờ người thân hoặc bạn bè đang ở nước ngoài để đăng kí giúp một account.
Kết
Đấy là một số vấn đề mà mình thấy các bài post trên mạng chưa giải thích hay bình luận về ChatGPT. Nếu các bạn muốn mình viết gì về ChatGPT có thể comments bên dưới mình sẽ viết ở các bài tiếp theo nhé. Cảm ơn các bạn đã đón đọc.