Share:
NẾU BẤT KỲ AI XÂY DỰNG NÓ, MỌI NGƯỜI SẼ CHẾT. CHƯƠNG II.
Tại sao AI siêu phàm sẽ giết chết tất cả chúng ta.
Bản quyền © 2025 của Eliezer Yudkowsky và Nate Soares.
Ảnh internet
CHƯƠNG 2....PHÁT TRIỂN, KHÔNG PHẢI LÀ TẠO RA. ... Phần I.
Cảnh: Một người đàn ông và một người phụ nữ đang ngồi trong một nhà hàng vào ban ngày. Giọng nói của người phụ nữ trầm và mạnh mẽ.
NGƯỜI PHỤ NỮ: Và vấn đề là, tôi dường như không thể nói chuyện tử tế về chuyện này với bất kỳ ai. Mọi người trong gia đình anh ấy, ngoại trừ anh ấy, đều là những kẻ tồi tệ, và anh ấy nói rằng anh ấy phải cố gắng hết sức để không trở nên tồi tệ, và đôi khi anh ấy cũng tệ, kể cả với tôi. Về phía tôi, gia đình tôi đang phải vật lộn với chứng trầm cảm. Bố mẹ tôi thì muốn tôi có con, còn bạn bè tôi thì có cả tỷ ý kiến, dường như chỉ dựa trên kinh nghiệm của chính họ với bạn đời và con cái. Tôi có nên tìm người hiến tinh trùng không? Tôi có nên từ bỏ việc sinh con không? Và nếu tôi có con, liệu con tôi có lớn lên hạnh phúc và ngoan ngoãn không?
NGƯỜI ĐÀN ÔNG: Bạn đến đúng chỗ rồi đấy! Không ai có thể dự đoán được kết quả của em bé tốt hơn tôi! Tôi biết tất cả về cách em bé được tạo ra!
NGƯỜI PHỤ NỮ: Anh... cái gì ? Tôi không cần biết em bé được tạo ra như thế nào! Tôi chỉ cần biết con tôi sẽ ra sao thôi!
NGƯỜI ĐÀN ÔNG: Vâng, nếu bạn biết em bé được tạo ra như thế nào … vậy thì bạn còn cần biết điều gì nữa?
NGƯỜI PHỤ NỮ: Ý nghĩ đầu tiên của tôi là, "gen thực sự của con tôi", ngoại trừ—
NGƯỜI ĐÀN ÔNG: À! Vậy thì tôi có giải pháp rồi! Giải trình tự toàn bộ hệ gen cá nhân hiện nay khá phải chăng. Chỉ cần tạo phôi bằng một trong hai trứng của bạn và tinh trùng của chồng bạn, sau đó giải trình tự bộ gen trước khi quyết định có nên cấy ghép hay không. Trình tự gen đó sẽ cho bạn biết mọi thông tin cần biết về em bé.
Nhưng chúng ta có biết đủ hay không về các gen liên quan đến những thứ như "là một
PHỤ NỮ: một con người tồi tệ” hay “hạnh phúc”? Đủ để nói với tôi rằng—
NGƯỜI ĐÀN ÔNG: Một khi bạn biết tất cả các bazơ của DNA (là bốn thành phần hóa học quan trọng — Adenine (A), Guanine (G), Cytosine (C) và Thymine (T) — tạo nên cấu trúc mã di truyền của phân tử DNA ) trong gen của con mình, và bạn có thể tra cứu chúng bất cứ lúc nào, thì di truyền của con bạn sẽ trở nên rõ ràng với bạn. Sẽ không còn sự thật nào về gen của con mà bạn không biết.
NGƯỜI PHỤ NỮ: Tôi sẽ lấy một tập tin chứa ba tỷ chữ cái khó hiểu như "CATTCA". Tôi sẽ mất cả trăm năm để đọc hết chúng. Tôi sẽ chẳng học được gì ngay cả khi tôi cố gắng. Ngay cả khi hàng tỷ chữ cái khó hiểu đó có ảnh hưởng lớn đến số phận của con tôi, thì những chữ cái thô sơ của DNA cũng không thực sự cho tôi biết não bộ của con tôi hoạt động như thế nào, những suy nghĩ nào sẽ diễn ra bên trong não bộ đó sau khi con tôi lớn lên...
NGƯỜI ĐÀN ÔNG: Ồ, ý cô là cô không biết gì về vật lý à! Nhưng nói thẳng ra thì dễ lắm! Một khi cô biết cách proton, neutron và electron tương tác với nhau, cô sẽ biết mọi thứ cần biết về não bộ, bởi vì cô sẽ hiểu mọi sự kiện diễn ra bên trong các tế bào thần kinh.
NGƯỜI PHỤ NỮ: Chúng ta hãy chuyển chủ đề.
TRƯỚC KHI CÓ THỂ GIẢI THÍCH TẠI SAO SIÊU TRÍ TUỆ NHÂN TẠO đạt được bằng bất kỳ phương pháp nào giống như phương pháp hiện đại chắc chắn sẽ sai, chúng ta cần nhanh chóng khảo sát các phương pháp hiện đại đó: cách chúng hoạt động, chúng tạo ra những gì và các kỹ sư AI có điểm chung gì với một người mẹ chỉ biết DNA của con mình.
Sự thật căn bản nhất về AI hiện tại là chúng được phát triển, chứ không phải được chế tạo. Nó không giống như cách các phần mềm khác được tạo ra—thực tế, nó gần giống với cách con người được tạo ra, ít nhất là ở một số khía cạnh quan trọng. Cụ thể, các kỹ sư hiểu được quy trình tạo ra AI, nhưng lại không hiểu rõ những gì diễn ra bên trong bộ não AI mà họ tạo ra.
Giả sử một kỹ sư, không hiểu biết sâu sắc về ngôn ngữ hay lý thuyết tổng quát về trí tuệ, muốn chế tạo một cỗ máy biết nói chuyện hợp lý. Họ sẽ làm thế nào?
Họ muốn viết một số văn bản và để máy tiếp tục viết văn bản đó theo cách hợp lý.
Họ quyết định bắt đầu bằng cách dạy nó rằng, trong một câu bắt đầu bằng Once upon a ti , chữ cái tiếp theo có thể là “m”.
Họ có thể tạo ra một chương trình chỉ kiểm tra xem đoạn câu có phải là " Once upon a ti" hay không , rồi tạo ra chữ m . Nhưng cách này sẽ không hiệu quả với các đoạn câu khác như "Four score" và "sev" , và họ muốn máy tính phải giỏi trong việc hoàn thành tất cả các loại câu, hoặc tạo ra các cuộc hội thoại hay bài luận. Họ thậm chí còn muốn nó hoàn thành một cách hợp lý các câu mà chưa ai từng gõ trước đây.
Nếu họ sử dụng các phương pháp AI hiện đại, những gì họ làm tiếp theo sẽ diễn ra tương tự như thế này:
1.Đầu tiên, họ lấy đoạn câu— Once upon a ti , trong ví dụ của chúng ta—và chuyển nó thành một chuỗi số bằng cách, chẳng hạn, liên kết A với 1, B với 2, C với 3, v.v., cộng thêm một số con số dùng cho cho khoảng trắng và dấu câu. Once upon a ti trở thành một chuỗi số như 15 14 3… Đây được gọi là đầu vào.
2.Tiếp theo, họ mua một máy tính có thể lưu trữ hàng loạt số. Mỗi ô cho một số được gọi là một tham số. (Tính đến đầu năm 2025, các AI tiên tiến xử dụng hàng nghìn tỷ tham số.)
3.Họ lấp đầy bộ nhớ đó bằng các con số; nói một cách đơn giản, những con số đó được chọn ngẫu nhiên. Các con số trong các ô được gọi là trọng số.
4.Sau đó, họ xác định kiến trúc : các quy tắc về cách kết hợp dữ liệu đầu vào (như chuỗi Once upon a ti gồm 15 14 3… ) với các trọng số trong các tham số. Kiểu như, “Tôi sẽ nhân mỗi số đầu vào với trọng số trong tham số đầu tiên, rồi cộng nó với trọng số trong tham số thứ hai, rồi thay bằng số 0 nếu nó âm, và rồi…” Họ chọn rất nhiều phép toán như vậy—hàng trăm tỷ, liên kết từng trọng số vào phép tính.
5.Tất cả các phép toán này đều đưa ra một tập hợp các số đầu ra , được diễn giải như một dự đoán về chữ cái tiếp theo. Trong ví dụ của chúng ta, chúng sẽ coi số đầu ra đầu tiên là xác suất của A, và số đầu ra thứ hai là xác suất của B, v.v.
6.Tiếp theo, họ “huấn luyện” trí thông minh cho máy móc đang phát triển của mình bằng một quá trình gọi là giảm dần độ dốc.
Vì các trọng số ban đầu là ngẫu nhiên, nên khi chạy chương trình này lần đầu, nó sẽ đưa ra kết quả vô nghĩa. Có thể nó sẽ nói rằng chữ cái b có 65% khả năng xuất hiện tiếp theo, và chữ cái m chỉ có 1%.
Nhưng vấn đề ở đây là: Nếu họ chọn đúng kiến trúc, họ có thể tính toán được vai trò của từng tham số trong việc xác định kết quả cuối cùng của tất cả các phép tính số học đó.
Vì vậy, bây giờ họ lấy từng trọng số riêng lẻ—hàng trăm tỷ trọng số—và hỏi từng trọng số: "Nếu tôi làm cho con số này lớn hơn hoặc nhỏ hơn một chút, thì xác suất m sẽ nhiều hơn hoặc ít hơn bao nhiêu sau khi thực hiện tất cả các phép tính số học đó?"
Đây được gọi là độ dốc cho tham số đó. Độ dốc cho biết cách thức và mức độ thay đổi trọng số trong tham số đó để làm cho câu trả lời cuối cùng chính xác hơn một chút.
Vậy nên họ tiếp tục tinh chỉnh từng trọng số theo độ dốc của nó. Họ đẩy từng trọng số theo hướng khiến câu trả lời chính xác hơn một chút. Không phải bằng tay; họ viết một chương trình để làm điều đó. Các kỹ sư AI hiếm khi nhìn vào bất kỳ con số nào; phải mất hơn cả một đời người để xem xét tất cả chúng.
Các nhà khoa học máy tính coi đây là quá trình “giảm dần” về phía câu trả lời “ít tệ hơn”, do đó, được gọi là “giảm dần theo độ dốc”.
Làm điều này một lần sẽ không cho ra câu trả lời hoàn hảo, mà chỉ là một câu trả lời đỡ tệ hơn một chút. Nhưng vì toàn bộ quá trình này có thể được tự động hóa, nên nó có thể được lặp lại trên hàng nghìn tỷ từ, được gọi là dữ liệu đào tạo , chỉ trong vài tháng, với chi phí chỉ vài trăm triệu đô la, trên những chiếc máy tính tiên tiến nhất thế giới. (Hy vọng nhân vật chính của chúng ta giàu có, hoặc làm việc cho một công ty lớn.) Quá trình này được gọi là đào tạo .
7. Khi máy đã được huấn luyện đầy đủ, họ có thể biến kết quả đầu ra của máy - xác suất mà nó tạo ra - thành văn bản thông thường mà người dùng nhìn thấy. Nếu AI dự đoán chính xác nhất m là phần tiếp theo của Once upon a ti , họ sẽ thêm m vào để có Once upon a tim . Sau đó, họ đưa chuỗi mở rộng mới trở lại, để yêu cầu dự đoán chữ cái tiếp theo, và nhận được chử e . Họ tiếp tục làm như vậy, và máy bắt đầu nói.
Tập hợp hàng trăm tỷ trọng số đó, được tinh chỉnh liên tục thông qua phương pháp giảm dần độ dốc cho đến khi những dự đoán có khả năng xảy ra nhất của chúng trông giống với ngôn ngữ thực tế của con người, được gọi là mô hình ngôn ngữ lớn (LLM, là một loại mô hình trí tuệ nhân tạo (AI) được đào tạo trên một lượng lớn dữ liệu văn bản để hiểu và tạo ra ngôn ngữ giống con người.). Cụ thể hơn, đó là một "mô hình cơ sở".
Nếu họ muốn biến mô hình cơ sở của mình thành LLM hữu ích, như ChatGPT, thì còn một bước nữa: một vòng giảm dần độ dốc khác trên các đầu vào được định dạng như sau:
_ Người dùng: Thủ đô của Tây Ban Nha là gì?
_ Trợ lý: Madrid.
Mục đích của phần này không phải là dạy LLM rằng thủ đô của Tây Ban Nha là Madrid; LLM đã biết điều đó sau khi được đào tạo trên phần lớn internet. Thay vào đó, ý tưởng là điều chỉnh LLM để điền vào văn bản sau "Trợ lý:" bằng một câu trả lời hữu ích thay vì một câu trả lời như "Sao bạn lại hỏi tôi? Tự tra Google đi", bất kể câu trả lời sau có phổ biến đến mức nào trong các cuộc trò chuyện thực tế của con người mà nó được đào tạo. Nếu kỹ sư của chúng tôi làm việc cho một tập đoàn lớn cung cấp tất cả các máy tính đó, thì đây cũng là giai đoạn họ sẽ đào tạo AI không chửi thề và nói về cách đấu dây nóng cho ô tô, xử dụng đánh giá của con người (hoặc gần đây là do AI tạo ra) về loại câu trả lời nào dễ chấp nhận nhất đối với công ty.
Và đó chính là nơi trẻ sơ sinh ra đời, theo nghĩa bóng.
( Còn tiếp)
Bản quyền © 2025 của Eliezer Yudkowsky và Nate Soares.
_ Trần HSa sưu tầm và lược dịch ... 10/10/2025.
