Ai xếp hạng sức mạnh của ChatGPT, Gemini ?
![]() |
Chatbot Arena là bảng xếp hạng AI do chính người dùng bình chọn. Ảnh: Midjourney/THE DECODER. |
Cũng như bảng xếp hạng Billboard Hot 100 là thước đo tiêu chuẩn cho độ phổ biến của các sản phẩm âm nhạc,ếphạngsứcmạnhcủkết quả c1 nam các chatbot Trí tuệ Nhân tạo (AI) cũng có một “đấu trường” riêng được xây dựng và điều hành bởi hai nghiên cứu sinh mang tên “Chatbot Arena”.
Hai người bạn cùng phòng Anastasios Angelopoulos và Wei-Lin Chiang không ngờ rằng dự án nghiên cứu của họ đã nhanh chóng trở thành bảng xếp hạng được theo dõi nhiều nhất về các hệ thống AI.
Cách mới để đánh giá AI
Ra mắt vào tháng 4/2023, Chatbot Arena nhanh chóng trở thành một hiện tượng khi thu hút hơn 4.700 lượt bình chọn chỉ trong tuần đầu tiên.
Theo truyền thống, hiệu năng của các công nghệ AI được đánh giá qua các bài kiểm tra chuyên sâu về toán học, khoa học và luật pháp. Tuy nhiên, Chatbot Arena cung cấp một phương pháp đánh giá mới, cho phép người dùng trực tiếp so sánh khả năng của các mô hình AI thông qua việc đặt câu hỏi và nhận câu trả lời.
Những đánh giá này được tổng hợp thành một bảng xếp hạng, nơi các tên tuổi lớn của Thung lũng Silicon như OpenAI, Google và Meta Platforms tranh giành ngôi vị cao nhất.
![]() |
Anastasios Angelopoulos (phải) và Wei-Lin Chiang (trái), hai nhà đồng sáng lập Chatbot Arena. Ảnh: Laura Morton/WSJ. |
“Mọi người đều đang cố gắng để đứng đầu bảng xếp hạng này, thật tuyệt vời khi một vài sinh viên tập hợp lại và có thể tạo ra tác động to lớn như vậy”, Joseph Spisak, giám đốc quản lý sản phẩm tại Meta Platforms, cho biết.
Khi cuộc đua AI ngày càng “nóng lên”, bất kỳ lợi thế nào so với đối thủ cạnh tranh cũng có thể tạo ra sự khác biệt lớn trong việc thu hút khách hàng và nhân tài. Điều này càng khiến Chatbot Arena thu hút sự chú ý.
Từ khi ra mắt với chỉ 9 mô hình AI, Chatbot Arena đã không ngừng mở rộng, hiện nay đã đánh giá và xếp hạng hơn 170 mô hình khác nhau với hơn hai triệu lượt bình chọn. Nền tảng này cũng cung cấp các bảng xếp hạng chi tiết cho nhiều lĩnh vực như sáng tạo nội dung và lập trình.
Chatbot Claude của Anthropic hiện đứng đầu bảng xếp hạng, sau khi soán ngôi OpenAI vào tháng 3 năm nay.
Đánh giá theo cảm tính
Các nhà nghiên cứu đã nhận thấy rằng các bài kiểm tra học thuật truyền thống đang dần mất đi hiệu lực. Nguyên nhân là do các câu hỏi trong những bài kiểm tra này đã được tích hợp vào các mô hình ngôn ngữ lớn (LLM), giúp các hệ thống AI học thuộc và trả lời một cách máy móc, qua đó làm giảm tính khách quan của kết quả đánh giá.
Google và OpenAI đã đạt được điểm số trên 90% trong bài kiểm tra Đo lường Hiểu biết Ngôn ngữ Đa nhiệm Khổng lồ (MMLU), một tiêu chuẩn đánh giá khả năng hiểu ngôn ngữ của các mô hình AI đã được sử dụng rộng rãi trong bốn năm qua.
Dan Hendrycks, một trong những người tạo ra bài kiểm tra này, đã phát động chiến dịch kêu gọi cộng đồng cùng nhau xây dựng một bộ câu hỏi cực khó, được ông đặt tên là "Bài kiểm trí tuệ nhân tạo cuối cùng". Mục tiêu của dự án này là đặt ra những câu hỏi hóc búa nhất để đánh giá toàn diện khả năng của các hệ thống AI.
![]() |
Người dùng sẽ tương tác trực tiếp với 2 mô hình ngôn ngữ và chọn ra câu trả lời hay hơn. |
"Mặc dù một chuẩn đánh giá ban đầu có thể rất khó đối với các LLM, những thế hệ LLM tiếp theo sẽ xuất hiện và đạt được hiệu suất gần như hoàn hảo", Tiến sĩ Colin White, Giám đốc Nghiên cứu tại Abacus.AI, đơn vị phát triển chuẩn đánh giá AI LiveBench, cho biết.
Cách tiếp cận "đối đầu" của Chatbot Arena, mặc dù thú vị, không phải lúc nào cũng đảm bảo tính chính xác và khách quan. Việc đánh giá dựa trên cảm nhận cá nhân khó có thể đo lường được các tiêu chí cụ thể của một chatbot. Do đó, một số nhà nghiên cứu gọi cách tiếp cận này là "đánh giá dựa trên cảm nhận".
Đội ngũ phát triển Chatbot Arena đã rất thẳng thắn trong việc công khai các hạn chế của nền tảng. Để giúp người dùng có cái nhìn khách quan hơn, họ cho phép người dùng tự do loại bỏ những yếu tố chủ quan như độ dài câu trả lời hay định dạng khi đánh giá các mô hình.
Đóng góp cho cộng đồng
Angelopoulos và Chiang đã kêu gọi nhiều nhà nghiên cứu khác để cùng xây dựng một nền tảng tương tự như Wikipedia, nơi cộng đồng có thể cùng nhau đóng góp và phát triển kiến thức về Trí tuệ Nhân tạo. Quan trọng hơn, họ khẳng định rằng dự án này hoàn toàn phi lợi nhuận.
Chatbot Arena cũng đóng vai trò quan trọng trong việc thúc đẩy sự phát triển của cộng đồng AI. Nhờ nền tảng này, người dùng có thể khám phá ra các mô hình ngôn ngữ mới. Điển hình là sự xuất hiện bất ngờ của "im-also-a-good-gpt2-chatbot", sau đó được xác nhận là GPT-4o.
![]() |
Các thành viên của nhóm dự án Chatbot Arena hầu hết là sinh viên đại học. Ảnh: Laura Morton/WSJ. |
Theo Chatbot Arena, xAI của Elon Musk, Meta và Google cũng đã thử nghiệm các công nghệ trên trang web trước khi được phát hành rộng rãi.
"Chúng tôi nhận được yêu cầu từ các công ty mỗi ngày”, nhà đồng sáng lập Chiang cho biết.
Vào tháng 10, một mô hình AI từ công ty Trung Quốc có tên “01.AI” đã bất ngờ xuất hiện ở vị trí thứ 6 trên bảng xếp hạng, thu hút sự chú ý đến những tiến bộ của Trung Quốc trong lĩnh vực này.
Kai-Fu Lee, cựu giám đốc điều hành Google và hiện là CEO của 01.AI, đã quảng bá thành tích này trên nền tảng X. Ông cho biết mô hình này đã vượt qua phiên bản đầu tiên của GPT-4o của OpenAI.
Những phản hồi của người dùng trên Chatbot Arena đã trở thành một kho dữ liệu quý giá đối với các nhà phát triển. Angelopoulos và Chiang cho biết họ đã chia sẻ khoảng 20% dữ liệu này, để cộng đồng nghiên cứu có thể tận dụng mà không làm ảnh hưởng đến tính bảo mật và công bằng của nền tảng.
Dùng ChatGPT thế nào để không tạo ra nội dung vô tri
Sự phát triển của AI mở ra nhiều tiềm năng nhưng cũng có không ít mối lo đối với ngành xuất bản, đặc biệt là nhóm tác giả viết sách.
Các tác giả sách cần phải chấp nhận sự vươn lên của AI, sử dụng chúng như một "siêu trợ lý" thay vì chối bỏ trào lưu. Chia sẻ với Tri thức - Znews, nhiều cây viết cho rằng người làm sách vẫn có thể đứng vững trong thời đại AI nếu biết cách tận dụng sức mạnh của trí tuệ nhân tạo.
相关推荐
-
Nhận định, soi kèo Andorra vs Latvia, 2h45 ngày 22/3: Tin vào khách
-
Bộ TT&TT vừa quyết định bổ nhiệm có thời hạn ông Hồ Tuấn và bà Phan Thị Hoa Mai giữ chức thành viên Hội đồng Thành viên Tổng Công ty Viễn thông MobiFone.Ban hành điều lệ tổ chức hoạt động của MobiFone" alt="Bổ nhiệm thêm 2 thành viên HĐTV cho MobiFone">
Bổ nhiệm thêm 2 thành viên HĐTV cho MobiFone
-
Biệt thự đảo Ecopark - sản phẩm bất động sản cao cấp nhất tại KĐT Ecopark
Dễ dàng nhận thấy quan điểm kinh doanh của Titan đang có sự hòa nhịp trong dòng chảy thời đại tại Ecopark. Còn nhớ, trong một lần chia sẻ với báo giới, đại diện ban lãnh đạo tập đoàn Ecopark cũng từng nói rằng triết lý phát triển kinh doanh của Ecopark là ở từ “sống”. Kinh doanh bất động sản không phải là bán được bao nhiêu ngôi nhà mà phải xem bao nhiêu ô cửa sáng đèn khi về đêm, tức là phải tạo ra môi trường sống thực sự.
Nhìn nhận trong dài hạn, chính sự đồng điệu trong triết lý kinh doanh của Titan Group và Ecopark sẽ là chìa khóa cho sự hợp tác thành công.
Minh chứng đó là, trong giai đoạn đầu mở bán dự án biệt thự đảo Ecopark Grand - The Island, Titan Group luôn nằm trong top những đại lý đạt doanh số cao nhất trong hệ thống phân phối của Tập đoàn.
Cơ hội và thách thức trong năm 2020
Tiếp nối sự thành công của dự án biệt thự đảo Ecopark Grand - The Island, năm 2020 Tập đoàn Ecopark tiếp tục cho ra mắt thị trường nhiều dự án mới với sự đa dạng như nhà phố, biệt thự, dự án thương mại, cho đến các dự án cao tầng hợp tác cùng các đối tác lớn của Nhật Bản, Hàn Quốc.
Được biết, đây sẽ là năm bản lề, đánh dấu sự phát triển bứt phá trên nhiều lĩnh vực của tập đoàn. Chính vì thế, lựa chọn các đại lý phân phối lại càng được tập đoàn Ecopark cân nhắc kỹ lưỡng.
Titan tiếp tục là đại lý phân phối các dự án của Tập đoàn Ecopark năm 2020 Với sự thành công trong dự án Biệt thự đảo, đặc biệt là kinh nghiệm và tâm huyết đối với các sản phẩm của Ecopark, Titan Group tiếp tục là một trong số những đại lý sẽ đồng hành cùng tập đoàn Ecopark trong năm 2020. Đây là cơ hội, đồng thời cũng là thách thức cho Titan Group để một lần nữa khẳng định là đối tác chiến lược, bền vững của Tập đoàn Ecopark.
Titan - Đại lý phân phối chính thức các dự án của Tập đoàn Ecopark.
Hotline: 0995.44.66.88
Website: https://titangroup.vn/biet-thu-dao-ecopark/
Add: Tầng 10, số 434, Trần Khát Chân, Hai Bà Trưng, Hà Nội.
Lệ Thanh
" alt="Titan tiếp tục đồng hành cùng nhiều dự án của Ecopark">Titan tiếp tục đồng hành cùng nhiều dự án của Ecopark
-
Hà Nội có 2 ca dương tính nCoV mới liên quan BV K và BV Bệnh nhiệt đới TƯ
Trưa 11/5, Trung tâm Kiểm soát bệnh tật (CDC) Hà Nội thông tin về 2 ca dương tính SARS-CoV-2 mới trên địa bàn.
" alt="Một cán bộ tư pháp ở Thường Tín, Hà Nội dương tính Covid">Một cán bộ tư pháp ở Thường Tín, Hà Nội dương tính Covid
-
Nhận định, soi kèo Gwangju vs Pohang Steelers, 14h00 ngày 22/3: Khó tin cửa dưới
-
Tesla trở thành cơn sốt trong thế giới ô tô. (Ảnh: Telsa)
Tesla Model S là một trong những chiếc EV bán chạy nhất trên thị trường và khiến các đối thủ mới như Porsche Taycan và Audi e-Tron GT phải ra sức chạy đua.
Phiên bản hiệu năng cao Model S Plaid vừa được tiết lộ gần đây, hiện đang là mũi tên chiến lược của dòng Tesla Model S, nhờ đạt tốc độ 0-96 km/h chưa đầy 2 giây. Nhưng trước khi Plaid xuất hiện thì Model S đã là kẻ thống trị cuộc đua hiệu suất.
Tesla Model S có phạm vi hoạt động đáng nể là 560 km. (Ảnh: Telsa) Vào tháng 4 năm 2019, Tesla đã công bố bản cập nhật cho Model S với hệ thống truyền động Raven nhằm tăng phạm vi hoạt động và hiệu suất của nó mà không làm tăng dung lượng pin.
Tesla Model S sử dụng pin công suất 100kWh, được trang bị động cơ nam châm vĩnh cửu ở trục trước, sản sinh công suất 275 mã lực và mô-men xoắn 310 lb-ft. Xe có một động cơ cảm ứng ở trục sau với công suất 503 mã lực và mô-men xoắn 531 lb-ft. Nhờ đó, xe được gia tăng phạm vi hoạt động thêm 10% và cải thiện đáng kể về hiệu suất.
Ngoài ra, Tesla Model S được trang bị hệ thống treo khí nén có khả năng điều khiển trực tiếp hệ số đàn hồi để thay đổi chiều cao và thích nghi với các điều kiện chuyển động của ô tô.
Đồng thời, nó cho phép xe được sạc ở mức 200 kW trên hệ thống sạc thế hệ thứ 3 (V3 Superchargers) và 145 kW trên hệ thống sạc thế hệ thứ 2 (V2 Superchargers), giúp bộ pin của Model S được sạc lại với tốc độ nhanh hơn 50%.
Nhờ các bản cập nhật, Model S Performance 2020 với chế độ Ludicrous có thể tăng tốc 0-96 km/h chỉ trong 2,4 giây. Đặc biệt, ở chế độ tăng tốc nhanh “Cheetah stance” thời gian tăng tốc sẽ rút ngắn thêm 1/10 giây! Có thể đạt được tốc độ tối đa 262 km/h.
Model S Performance năm 2020 có phạm vi hoạt động đáng nể lên đến 560 km, theo xếp hạng của EPA.
Model S có nội thất tối giản với màn hình cảm ứng 17 inch. (Ảnh: Telsa) Kể từ khi ra đời, Model S hầu như không thay đổi trong thiết kế. Phiên bản năm 2020 không có gì khác biệt nhưng nó vẫn toát lên vẻ bóng bẩy và hiện đại.
Một số điểm nổi bật của mẫu Performance bao gồm: Bộ 2 Đèn LED DRLs, nóc kính màu, bánh xe hợp kim 19 -21 inch, cánh lướt gió bằng sợi carbon và tay nắm cửa có thể thu vào.
Model S có nội thất tối giản, chiếm ưu thế bởi màn hình cảm ứng 17 inch, điều khiển hầu hết mọi chức năng từ kiểm soát khí hậu, điều hướng đến thông tin giải trí.
Các trang bị tiêu chuẩn bao gồm: ghế lái chỉnh điện 12 hướng, ghế trước và sau có đệm sưởi, cửa xe sẽ được mở bằng smartphone và không còn chìa khoá, camera lùi HD, kiểm soát khí hậu 2 vùng và 8 túi khí.
Theo tiêu chuẩn, Model S được trang bị nội thất bên trong bằng gỗ tần bì màu đen. Người mua phải trả một khoản chi phí từ 1.500 đô la đến 2.000 đô la để có thể tùy chọn màu sắc khác nếu muốn.
Xe có 5 chỗ ngồi được bọc da êm ái, khoang hàng với sức chứa gần 0.74 m3. Vì vậy, Model S là một chiếc xe hữu dụng hơn so với những chiếc sedan cùng kích thước khác.
Công nghệ tự lái Autopilt tiêu chuẩn trên Model S giúp: cảnh báo va chạm, phanh khẩn cấp, giám sát điểm mù, kiểm soát hành trình thích ứng và hỗ trợ giữ làn đường. Người dùng có thể chọn khả năng tự lái hoàn toàn và phải trả thêm 7.000 đô la cho các tính năng như: chuyển làn đường tự động, tính năng triệu hồi xe thông minh “Smart Summon” giúp người lái có thể dễ dàng lấy xe ra khỏi những bãi đỗ xe chật hẹp.
Một chiếc Model S đã qua sử dụng vẫn có giá khá cao. (Ảnh: Telsa) Vào thời điểm ra mắt thị trường, Tesla Model S Performance 2020 từng có giá bán lẻ 93.190 đô la (khoảng 2,1 tỷ đồng). Nếu thêm các tính năng tùy chọn, đặc biệt là chức năng 'Tự lái hoàn toàn' thì xe có mức giá hơn 100.000 đô la (khoảng 2,3 tỷ đồng).
Giá hiện nay cho một chiếc Model S đã qua sử dụng vẫn khá cao, dao động từ 90.000 đô la đến 95.000 đô la (tức 2-2,2 tỷ đồng).
Phương Ánh(Theo Hotcars)
Bạn đang sở hữu những chiếc xe độc, lạ, bản độ đẹp? Hãy chia sẻ thông tin và hình ảnh về Ban Ô tô xe máy theo email: otoxemay@vietnamnet.vn. Các nội dung phù hợp sẽ được đăng tải. Xin cảm ơn!
Xe Tesla bị điều tra vì hay tự đâm vào những thứ nhấp nháy
Chính phủ Mỹ mở cuộc điều tra về hệ thống lái xe tự động một phần của Tesla sau nhiều vụ đâm vào phương tiện cấp cứu đậu bên đường.
" alt="Khám phá sức hút của Tesla Model S 2020">Khám phá sức hút của Tesla Model S 2020
- 最近发表
-
- Nhận định, soi kèo Ecuador vs Venezuela, 4h00 ngày 22/3: Bất ngờ từ đội khách
- Link xem trực tiếp Arsenal vs Chelsea, 00h30 ngày 27/12
- FPT cảnh báo website giả mạo lừa khách hàng nạp thẻ viễn thông
- Cuối năm 2015 là thời điểm chín muồi để Việt Nam triển khai 4G
- Nhận định, soi kèo Uruguay vs Argentina, 06h30 ngày 22/3: Mất Messi, mất hết
- Đồng Nai: Đột nhập FPT Shop trộm tài sản trị giá hơn 1 tỷ đồng
- Giám đốc Sở Tư pháp Đà Nẵng dương tính Covid
- VALORANT: Map tuyết mới toanh Icebox sẽ trình làng vào tuần tới
- Nhận định, soi kèo Guinea Bissau vs Burkina Faso, 23h00 ngày 24/3: Cạnh tranh vị trí nhì bảng
- Khởi tố 5 đối tượng chích điện, cắt tai con nợ
- 随机阅读
-
- Nhận định, soi kèo Israel vs Estonia, 2h45 ngày 23/3: Khởi đầu suôn sẻ
- TP. HCM cần thêm vắc xin Covid
- MG Astor chính thức lộ diện, cạnh tranh với Hyundai Creta, Kia Seltos
- Truy sát kinh hoàng ở miền Tây, 3 thanh niên tử vong
- Nhận định, soi kèo Colorado Rapids vs Portland Timbers, 8h30 ngày 23/3: Chủ nhà thăng hoa
- Hà Nam ghi nhận ca F2 dương tính Covid
- Thuê bao di động từ thành thị đổ dồn về quê
- Việt Nam xuất hiện thêm 2 biến chủng SARS
- Soi kèo phạt góc Uruguay vs Argentina, 06h30 ngày 22/3
- CitiGrand
- Thu Cúc ‘chưa thực hiện đúng quy định’ khi từ chối tiếp nhận bệnh nhân mắc Covid
- iPhone 12 ra mắt Hướng dẫn xem trực tiếp iPhone 12 đêm nay
- Nhận định, soi kèo Tepatitlan vs CA La Paz, 10h00 ngày 22/3: Dìm khách xuống đáy
- Đến năm 2030, công suất điện gió và điện mặt trời tăng khoảng 30.000MW
- Hà Nội yêu cầu tất cả cơ sở y tế không từ chối tiếp nhận ca nghi mắc Covid
- MobiFone sẽ hoàn tất cổ phần hóa trước T7/2016
- Nhận định, soi kèo Smederevo vs Trayal Krusevac, 21h00 ngày 24/3: Chia điểm?
- Bộ Y tế hoả tốc yêu cầu Yên Bái điều tra vụ BN 2857 mắc Covid
- Clip gí súng vào đầu cướp xe Mercedes trong đêm nóng nhất mạng xã hội
- Mẹo chụp ảnh màn hình iPhone bằng cách chạm tay vào mặt lưng thiết bị
- 搜索
-
- 友情链接
-