Kiến thức

Ngày 3/60: AI Tạo Sinh (LLM) Hoạt Động Như Thế Nào?

By hoaihung

Trong hai ngày qua, chúng ta đã nói nhiều về Prompt và cách Prompt tốt giúp AI làm việc hiệu quả hơn. Nhưng đằng sau những câu trả lời “biết tuốt” kia, AI Chatbot thực sự đang làm gì? Nó có “nghĩ” như con người không?

Hiểu về cơ chế hoạt động cơ bản của AI (mà giới chuyên môn gọi là Large Language Models – LLM) sẽ giúp chúng ta viết Prompt chính xác hơn, bớt kỳ vọng sai lầm và tận dụng tối đa sức mạnh của nó. Đừng lo, chúng ta sẽ chỉ tìm hiểu ở mức đủ dùng thôi, không cần đi sâu vào các mô hình toán học phức tạp đâu.

🎯 Mục Tiêu Hôm Nay:

  • Hiểu AI Chatbot thuộc nhóm Mô hình Ngôn ngữ lớn (LLM) là gì.
  • Nắm được cơ chế hoạt động cốt lõi: Dự đoán từ tiếp theo.
  • Hiểu ẩn dụ về cách AI “học” và “tạo” văn bản để có cái nhìn đúng đắn.

________________

💡 AI & PROMPT: NHỮNG ĐIỀU CẦN BIẾT

LLM – Những “Đọc Giả Siêu Tốc” và “Nhà Văn Thống Kê”: AI Chatbot như Gemini, ChatGPT là các mô hình Ngôn ngữ lớn (Large Language Models – LLM). “Lớn” ở đây nghĩa là chúng đã được “đào tạo” (Train) trên một lượng dữ liệu văn bản khổng lồ từ khắp nơi trên internet và sách vở. Chúng đọc tất cả những thứ đó!

  • Quá trình đào tạo này giúp AI học được mối quan hệ giữa các từ, cụm từ, câu, đoạn văn… Nó biết từ nào thường đi sau từ nào, trong ngữ cảnh nào thì dùng từ nào là hợp lý, cấu trúc câu phổ biến ra sao, và thậm chí là các sự kiện, khái niệm, phong cách viết.

Cơ Chế Hoạt Động Cốt Lõi: Dự Đoán Từ Tiếp Theo: Đây là bí mật lớn nhất (ở mức đơn giản) về cách LLM hoạt động. Khi bạn đưa cho nó một Prompt (một chuỗi từ), AI sẽ phân tích chuỗi từ đó và dựa trên kiến thức đã học, nó sẽ dự đoán từ nào có khả năng xuất hiện tiếp theo cao nhất.

  • Ví dụ: Nếu bạn gõ “Hôm nay trời…”, AI đã học từ rất nhiều văn bản rằng sau “Hôm nay trời…” thường là các từ như “đẹp”, “mưa”, “nắng”, “lạnh”… Nó sẽ tính toán xác suất cho từng từ đó dựa trên ngữ cảnh (nếu có) và thông tin khác.
  • Sau khi chọn được từ đầu tiên, nó lại lấy toàn bộ chuỗi từ mới (“Hôm nay trời [từ vừa chọn]…”) làm input và tiếp tục dự đoán từ tiếp theo. Quá trình này lặp đi lặp lại hàng nghìn, hàng vạn lần để tạo ra toàn bộ đoạn văn bản output cho bạn!
  • Hãy nghĩ về tính năng tự động hoàn thành khi bạn gõ trên điện thoại, nhưng ở mức siêu cấp!

AI “Học” và “Tạo” Như Thế Nào? (Ẩn Dụ)

  • Học: Tưởng tượng AI như một đứa trẻ được cho đọc toàn bộ thư viện quốc gia và toàn bộ internet. Nó không hiểu ý nghĩa sâu sắc như con người, nhưng nó ghi nhớ được mối liên hệ thống kê giữa các từ. Nó biết “táo” thường đi cùng “ăn”, “đỏ”, “quả”… Nó biết sau câu hỏi “Ai là tác giả…” thường là một cái tên.
  • Tạo: Khi bạn đưa Prompt, AI giống như đang chơi trò nối chữ dựa trên những gì nó đã học. Nó nhìn vào chuỗi từ hiện có, “nghĩ” (tính xác suất) xem từ nào phù hợp nhất để nối tiếp, thêm vào, rồi lại tiếp tục nối. Nó không thực sự “sáng tạo” theo cách con người nảy ra ý tưởng mới hoàn toàn, mà là “tái kết hợp” và “dự đoán” dựa trên kho dữ liệu khổng lồ.

Tại Sao Lại Có “Ảo Giác”? Vì AI chỉ làm việc với xác suất. Đôi khi, trong quá trình dự đoán từ tiếp theo, nó có thể chọn một từ hoặc một chuỗi từ có xác suất thấp hơn nhưng vẫn có khả năng xảy ra trong dữ liệu đào tạo, dẫn đến việc tạo ra thông tin không chính xác hoặc hoàn toàn bịa đặt. Hoặc dữ liệu đào tạo của nó có sẵn thông tin sai. Nó không có cơ chế “kiểm tra sự thật” như con người.

________________

🔍 TẠI SAO LẠI NHƯ THẾ?

  • Hiểu được AI chỉ là cỗ máy dự đoán từ giúp chúng ta lý giải tại sao Prompt cần rõ ràng. Prompt chính là “tín hiệu” ban đầu định hướng cho quá trình dự đoán đó đi đúng hướng. Nếu tín hiệu nhiễu loạn, kết quả sẽ lệch.
  • Nó cũng giúp chúng ta hiểu tại sao AI có thể trả lời lưu loát về một chủ đề, nhưng lại “bịa” ra thông tin sai lệch khi gặp chủ đề ít dữ liệu hoặc yêu cầu quá cụ thể mà không có trong kho học của nó.
  • Thay vì coi AI là “biết tuốt”, hãy coi nó là “chuyên gia dự đoán từ” dựa trên dữ liệu đã học. Bạn cần cung cấp Prompt để “kích hoạt” đúng phần kiến thức và định hướng quá trình dự đoán đó theo ý bạn.

🛠️ THỰC HÀNH NGAY (Prompt Mẫu):

Hãy thử một prompt đơn giản để quan sát cách AI “nối từ” và “hoàn thành” câu chuyện của bạn:

Prompt:

Hãy viết tiếp một đoạn văn bắt đầu bằng câu sau:
"Khi cánh cửa cũ kỹ kêu kẽo kẹt mở ra, tôi thấy..."

Hướng dẫn Input:

  • Copy prompt trên và dán vào AI Chatbot, gửi đi.
  • Đọc kỹ đoạn văn AI tạo ra. Quan sát cách nó nối tiếp từ câu mở đầu của bạn.

Output Mong Đợi/Phân Tích Output:

  • AI sẽ dựa vào cụm từ “cánh cửa cũ kỹ kêu kẽo kẹt mở ra” để dự đoán tiếp. Các từ tiếp theo có thể liên quan đến một căn phòng bí ẩn, một khung cảnh bất ngờ, một nhân vật…
  • Đoạn văn sẽ là chuỗi các từ được dự đoán nối tiếp nhau, tạo thành một câu chuyện (có thể logic hoặc hơi phi logic tùy AI và cài đặt).
  • Bài học: Bạn đã cung cấp “từ đầu tiên”, và AI đã sử dụng khả năng dự đoán của mình để “viết tiếp” câu chuyện dựa trên dữ liệu nó đã học về những gì thường xảy ra sau câu mở đầu như vậy trong hàng tỷ văn bản.

________________

✍️ BÀI TẬP VỀ NHÀ (Thử Thách Nhỏ)

  • Nghĩ ra một câu mở đầu thú vị cho một đoạn văn hoặc một câu chuyện.
  • Dùng câu mở đầu đó làm prompt và yêu cầu AI viết tiếp.
  • Thử yêu cầu AI viết tiếp với cùng câu mở đầu nhưng thêm một chút định hướng (ví dụ: “…tôi thấy… Hãy viết tiếp theo phong cách kinh dị/hài hước/lãng mạn”). Quan sát xem AI thay đổi cách dự đoán từ như thế nào.

TIP/LƯU Ý QUAN TRỌNG

  • Vì AI hoạt động dựa trên dự đoán xác suất, mỗi lần bạn gửi cùng một prompt, output có thể hơi khác nhau một chút (nhất là với các prompt thiên về sáng tạo). Điều này là bình thường!
  • Hiểu cơ chế dự đoán từ này giúp bạn hiểu tại sao việc cung cấp ngữ cảnh và ràng buộc (như chúng ta đã nói ở Ngày 1 & 2) lại cực kỳ quan trọng. Bạn đang giúp AI có cơ sở tốt hơn để đưa ra các dự đoán từ chính xác hơn, phù hợp với ý bạn.

➡️ Ngày Mai Chúng Ta Sẽ Cùng Nhau…

Sau khi hiểu AI hoạt động như một cỗ máy dự đoán từ, ngày mai chúng ta sẽ bắt đầu đi vào “bộ khung” cơ bản của một Prompt hiệu quả. Chúng ta sẽ khám phá thành phần đầu tiên của công thức WWH: What – Xác định Nội dung Cốt Lõi. Hẹn gặp lại!

#AILamBieng #60daysPromptMastery #PromptMastery #hoaihung