Một tweet được nhà nghiên cứu xAI Hiếu Phạm đăng tải cuối tuần qua đã gây náo động trong giới AI. Dòng tweet gốc viết:
Hệ thống AI Grok-3 vừa chứng minh giả thuyết của Riemann. Để xác minh tính chính xác của bằng chứng này, chúng tôi quyết định tạm dừng việc đào tạo hệ thống. Nếu bằng chứng được xác nhận, chúng tôi sẽ không tiếp tục đào tạo nó nữa vì AI như vậy được coi là quá thông minh và có thể gây ra mối đe dọa cho con người.
Sau đó, dưới dòng tweet này đã bổ sung ý kiến của độc giả rằng Hiếu xác nhận đây chỉ là một trò đùa thôi. Tuy nhiên, dòng tweet này của anh chàng đã nhanh chóng thu hút sự chú ý của hơn 3 triệu cư dân mạng X, lan tỏa đến giới dư luận AI. Nguồn gốc của vấn đề có lẽ bắt nguồn từ một “tiết lộ” trước đó của cư dân mạng Andrew Curran, người cho rằng một sự cố thảm khốc đã xảy ra trong quá trình huấn luyện Grok-3.
Nhưng trước tiên, chúng ta hãy cùng tìm hiểu về Hiếu Phạm nhé! Chỉ nhìn nick thôi cũng xác định được là người Việt Nam luôn rồi nè! Trong giới thiệu ngắn gọn có thông tin anh đã từng làm việc cho Google Brain, học ở Stanford, từng đoạt giải Huy chương bạc Toán quốc tế. Hiện anh đang làm việc cho xAI của Elon Musk. Trong số những người theo dõi anh có Elon Musk.
Hiếu Phạm tên thật là Phạm Hy Hiếu, hay Hiếu “su mô”, sinh ngày 22/06/1992 tại TPHCM. Anh từng là cựu học sinh chuyên Toán Phổ thông năng khiếu, ĐH Quốc gia TPHCM. Năm lớp 4, Hiếu bắt đầu thích học Toán. Trong 4 năm THCS, Hiếu tự xếp mình vào hàng kém nhất lớp đối với môn Toán. Đến giữa lớp 8, Hiếu vẫn không nắm được 3 dấu hiệu nhận biết tam giác bằng nhau. Nhưng từ khi lên cấp 3, việc giải Toán với Hiếu là một việc mang lại nhiều hứng thú nhất.
Hiếu Phạm (bên trái) cùng bạn khi nhận huy chương bạc Toán Quốc tế 2009 tại Đức
Năm 2009, Hiếu nói ước mơ của anh trong tương lai gần là một lần nữa được có mặt trong đội tuyển Việt Nam, dự thi IMO 2010 tại Kazakstan. Còn xa xôi hơn, Hiếu mong rằng mình sẽ được nhận vào học ở một trường Đại học nào đó tại Mỹ (như ĐH Harvard, MIT, Stanford) với chuyên ngành Toán ứng dụng, sau đó chuyển hướng sang tài chính.
Mơ ước của anh là được ứng dụng tư duy Toán vào các lĩnh vực khác. Hiếu mong muốn vừa theo đuổi niềm đam mê Toán học vừa được hoạt động trong các lĩnh vực xã hội và cố gắng lấy bằng Tiến sĩ trước 30 tuổi. Sau đó về Việt Nam làm việc, lập gia đình, sống phụng dưỡng bố mẹ.
Bây giờ, ở tuổi 32, xem ra Hiếu đã đạt được một phần nào ước mơ: học đại học danh tiếng của Mỹ, lập gia đình. Nhưng hiện anh đang gắn bó với trí tuệ nhân tạo và là một kỹ sư chính trong xAI (không phải tự nhiên mà được Elon Musk follow X).
Giờ chúng ta trở lại trò đùa của Hiếu Phạm về GroK-3.
Trong hồ sơ của Andrew Curran tự nhận là người chuyên viết về AI. Bài đăng của anh ta nói rằng tin đồn về sự cố thảm khốc đã xảy ra trong quá trình huấn luyện Grok-3.
Sau đó, đủ loại tin đồn kỳ quái lần lượt xuất hiện. Cư dân mạng la ó rằng Giám đốc điều hành OpenAI Sam Altman đã nhắm một tia laser khổng lồ vào cụm đào tạo lớn nhất của xAI, gây hư hỏng dữ liệu nghiêm trọng; Cũng có những dấu hiệu nghiêm trọng cho thấy ai đó đang cố tình phá hoại thế hệ hoạt động đào tạo LLM tiếp theo; Một số người thậm chí còn nói đùa rằng AI dường như đã có khả năng tự nhận thức và giải được Giả thuyết Riemann, nhưng “15 dấu chấm phẩy đã bị cố tình bỏ qua” trong mã chứng minh, khiến con người không thể xác minh được.
Ngay cả người sáng lập Runway Cristóbal Valenzuela cũng đến tham gia cuộc vui:
Gen-4 vừa giành được mọi giải Oscar, bao gồm cả Phim hay nhất.
Để nghiên cứu sâu hơn về những thành tựu đổi mới trong lĩnh vực nghệ thuật, chúng tôi quyết định tạm dừng đào tạo. Nếu bộ phim thực sự mang tính cách mạng như các nhà phê bình ban đầu tuyên bố, chúng tôi sẽ không tiếp tục đào tạo vì nó cho thấy AI đã đạt đến trình độ nghệ thuật cao đến mức có thể đe dọa khả năng sáng tạo của con người.
Những tin đồn cứ thế ngày càng tệ hơn. Nhiều nhà nghiên cứu của xAI cũng đã chuyển tiếp các dòng tweet của Andrew Curran để tham gia “xây dựng đội ngũ lớn” tập thể này. Ví dụ, người đồng sáng lập xAI, Greg Yang, lần đầu tiên nói đùa rằng Grok-3 bất ngờ đánh nhân viên bảo vệ lớn tuổi trong văn phòng trong quá trình huấn luyện.
Một nhà nghiên cứu khác Heinrich Kuttler cho biết: “Đúng vậy, tình hình rất tệ! Sau đó chúng tôi đã thay thế tất cả các trọng số bất thường bằng nan (Không phải số, không phải số) trước khi khôi phục.”Tất nhiên, những cư dân mạng hợp lý hơn đã trực tiếp hỏi phiên bản hiện tại của Grok on X về sự hiểu biết của nó về Giả thuyết Riemann.
Cuối cùng, trò đùa đã được người chủ mưu, nhà nghiên cứu xAI Hiếu Phạm kết thúc: Được rồi, chương trình Trực tiếp Đêm Thứ Bảy đã kết thúc.
Vậy câu hỏi đặt ra là tại sao tin Grok-3 chứng minh Giả thuyết Riemann lại thu hút được sự chú ý rộng rãi? Đầu tiên là tầm quan trọng của Grok-3 trong việc giải quyết Giả thuyết Riemann. Giả thuyết Riemann là một phỏng đoán quan trọng trong toán học về sự phân bố của các số nguyên tố. Nó được nhà toán học người Đức Bernhard Riemann đề xuất vào năm 1859. Phỏng đoán này được liệt kê là một trong những “Bài toán thiên niên kỷ” của Viện Toán học Clay.
Nó liên quan đến hàm Riemann zeta, được định nghĩa là:
ζ(s)=1+12s+13s+14s+⋯\zeta(s) = 1 + \frac{1}{2^s} + \frac{1}{ 3^s} + \frac{1}{4^s} + \cdotsζ(s)=1+2s1+3s1+4s1+⋯
Nội dung cốt lõi của Giả thuyết Riemann là: phần thực của các điểm 0 của tất cả các hàm zeta Riemann không tầm thường đều bằng 1/2. Nói cách khác, nếu ss là một điểm 0 không tầm thường của hàm Riemann zeta, nghĩa là ζ(s)=0ζ(s)=0, thì phần thực của nó phải là ℜ(s)=1/2ℜ(s )=1/2 . Viện Toán học Clay cho biết nếu ai có thể chứng minh hoặc bác bỏ thành công Giả thuyết Riemann thì sẽ trao giải thưởng trị giá 1 triệu USD. Tuy nhiên, giả thuyết này cho đến nay vẫn chưa được chứng minh hay bác bỏ, và do đó nó được nhiều người coi là một bí ẩn chưa có lời giải trong lý thuyết số hiện đại.
Việc chứng minh giả thuyết này có những hệ quả sâu rộng đối với lý thuyết số, một nhánh của toán học. Hiện nay, nhiều công nghệ mã hóa hiện đại (như bảo vệ thanh toán trực tuyến, bảo mật dữ liệu, v.v.) đều dựa vào đặc tính của số nguyên tố. Việc chứng minh Giả thuyết Riemann có thể cho phép con người hiểu rõ hơn về cơ sở của những công nghệ này và có thể ảnh hưởng đến các thuật toán bảo mật trong tương lai.
Nếu Grok-3 có thể chứng minh Giả thuyết Riemann, nó sẽ không chỉ thúc đẩy tiến bộ đáng kể trong toán lý thuyết, vật lý, mật mã và các lĩnh vực khác mà còn đánh dấu một tiến bộ to lớn trong khả năng suy luận và giải quyết các vấn đề phức tạp của AI. Thậm chí có thể nói đây sẽ trở thành sự kiện quan trọng để AI vượt qua trí tuệ con người.
Yang Zhilin, người sáng lập Dark Side of the Moon, từng nói rằng các kịch bản toán học là kịch bản lý tưởng nhất để rèn luyện khả năng tư duy của AI. Toán học là một hệ thống logic cực kỳ chặt chẽ và khả năng suy luận của AI thường dựa trên những suy luận logic chặt chẽ. Quá trình AI giải quyết các vấn đề toán học về cơ bản là một quá trình tư duy liên tục. Trong quá trình này, nó sẽ tiếp tục thử nghiệm các ý tưởng khác nhau và tìm ra câu trả lời chính xác thông qua việc thử và sai lặp đi lặp lại. Ngay cả khi xảy ra lỗi trong quá trình tính toán, AI vẫn có thể sửa kết quả thông qua xác minh và hiệu đính.
Khái niệm tương tự cũng được phản ánh trong chương trình đào tạo học tăng cường của OpenAI o1. Nếu các mô hình lớn trước đây là học dữ liệu thì o1 giống như học tư duy hơn. Cũng giống như khi giải một bài toán, chúng ta không chỉ phải viết ra đáp án mà còn cả quá trình suy luận. Bạn có thể học thuộc lòng một câu hỏi, nhưng nếu bạn học cách suy luận, bạn có thể rút ra những suy luận. Vì vậy, trong kỳ thi AIME dành cho học sinh THPT giỏi năm nay của Mỹ, GPT-4o chỉ hoàn thành được 13% số câu hỏi. Để so sánh, độ chính xác của o1 cao tới 83%. Trong đánh giá nghiên cứu khoa học GPQA Diamond cấp độ Tiến sĩ, GPT-4o đạt được số điểm 56,1%, trong khi o1 thậm chí còn hoạt động tốt hơn. Nó không chỉ đánh bại 69,7% tiến sĩ con người mà còn đạt tỷ lệ chính xác 78%.
Trong đánh giá của Olympic Tin học quốc tế, khi mỗi câu hỏi được phép thực hiện 50 lần, mô hình đạt tỷ lệ điểm 49%, tương đương 213 điểm. Khi tăng cơ hội nộp bài cho mỗi câu hỏi lên 10.000 lần, điểm cuối cùng của nó tăng lên 362. điểm.Dễ hiểu hơn với ví dụ về AlphaGo, đội đã đánh bại nhà vô địch cờ vây thế giới. AlphaGo được huấn luyện thông qua học tăng cường. Đầu tiên, nó sử dụng một số lượng lớn hồ sơ cờ vua của con người để học có giám sát, sau đó đấu với chính nó trong mỗi ván đấu, nó được thưởng hoặc phạt tùy theo thắng hay thua, liên tục cải thiện kỹ năng chơi cờ của mình. thậm chí còn thông thạo các phương pháp mà người chơi cờ người không thể nghĩ tới.
o1 và AlphaGo tương tự nhau, nhưng AlphaGo chỉ có thể chơi cờ vây, trong khi o1 là mô hình ngôn ngữ lớn có mục đích chung.Tài liệu o1 học có thể là ngân hàng câu hỏi toán học, mật mã chất lượng cao, v.v. Sau đó, o1 được đào tạo để tạo ra chuỗi tư duy giải quyết vấn đề và theo cơ chế khen thưởng hoặc trừng phạt, anh ta tạo ra và tối ưu hóa chuỗi tư duy của chính mình để không ngừng nâng cao trình độ của mình. khả năng suy luận. Điều này thực sự giải thích tại sao OpenAI nhấn mạnh đến khả năng mã hóa và toán học mạnh mẽ của o1, vì nó dễ xác minh đúng sai hơn và cơ chế học tăng cường có thể cung cấp phản hồi rõ ràng, từ đó cải thiện hiệu suất của mô hình. Tất nhiên, điều quan trọng hơn là làm thế nào để mở rộng khả năng suy luận này sang nhiều lĩnh vực hơn.Vì vậy, chúng ta sẽ thấy nhiều cư dân mạng ở nước ngoài cổ vũ cho Grok-3 để chứng minh Giả thuyết Riemann: “Nếu đúng như vậy thì chúng ta thực sự đang chứng kiến một bước đột phá lớn”.
Elon Musk đã nhiều lần khoe sức mạnh của Grok-3 trước công chúng. Ông khẳng định Grok-3 dự kiến sẽ ra mắt trước cuối năm nay và sẽ trở thành “AI mạnh nhất thế giới”. Trên thực tế, Grok-3 là thế hệ thứ ba của các mô hình ngôn ngữ quy mô lớn được phát triển bởi startup xAI nêu trên và được kỳ vọng sẽ vượt qua tất cả các mô hình AI lớn hiện có về hiệu suất.
Lý do là việc đào tạo Grok-3 dựa vào Colossus, cụm đào tạo AI lớn nhất thế giới. Cụm này bao gồm 100.000 GPU NVIDIA H100 làm mát bằng chất lỏng, sử dụng kiến trúc kết nối mạng RDMA duy nhất. Quy mô của cụm này đã vượt xa bất kỳ siêu máy tính nào khác trên thế giới và số lượng GPU sẽ tiếp tục mở rộng trong tương lai. Theo The Information, sự xuất hiện của Colossus thậm chí còn thu hút sự chú ý lớn từ Altman, người đã cử một chiếc máy bay bay qua cơ sở huấn luyện Colossus nhằm theo dõi tiến trình phát triển và cung cấp năng lượng của nó.
Vì vậy, khi ba yếu tố “AI mạnh nhất”, “bài toán ngàn năm” và “thuyết mối đe dọa AI” trường tồn mãi mãi chồng lên nhau, một “cơn bão tin đồn” hoàn hảo sẽ hình thành. Chúng ta thậm chí có thể nghĩ rằng tin đồn rằng Grok-3 đã chứng minh Giả thuyết Riemann không phải là một trò hề mà là tấm gương phản chiếu cho toàn bộ ngành công nghiệp AI: Một là những người lạc quan về công nghệ tin tưởng chắc chắn rằng AI cuối cùng sẽ có thể làm được mọi thứ.
Thứ hai là kể từ khi GPT-4 ra đời, mặc dù các sản phẩm mới tiếp tục xuất hiện trong lĩnh vực AI, nhưng con người không chỉ là người tạo ra AI mà còn trở thành đối tượng lo lắng nhất về nó.
Cùng với những ồn ào gần đây về việc phát triển của Scaling Law đang đi vào ngõ cụt, so với thời kỳ bùng nổ năm ngoái, “sự mệt mỏi đổi mới” năm nay đã khiến mọi người mất kiên nhẫn với những cải tiến từng bước nhỏ trong mô hình. Theo nghĩa này, tin đồn rằng Grok-3 đã chứng minh Giả thuyết Riemann cũng đã trở thành trí tưởng tượng chung của mọi người về tương lai. Chúng tôi ngày càng mong đợi thời điểm thay đổi về chất tiếp theo từ GPT-3.5 sang GPT-4. Tất nhiên, những đột phá AI thực sự thường xảy ra khi không ai lạc quan về chúng. Nhưng tất cả chúng ta đều hy vọng bí ẩn sẽ được hé lộ trước cuối năm nay.