Mistral được Microsoft hậu thuẫn ra mắt cloud AI châu Âu để cạnh tranh với AWS và Azure | VentureBeat

Tham gia sự kiện được các nhà lãnh đạo doanh nghiệp tin tưởng trong gần hai thập kỷ. VB Transform quy tụ những người xây dựng chiến lược AI doanh nghiệp thực sự. Tìm hiểu thêm Mistral AI, startup trí tuệ nhân tạo của Pháp, đã công bố hôm thứ Tư về việc mở rộng quy mô lớn sang cơ sở hạ tầng AI, định vị công ty là câu trả lời của châu Âu cho các gã khổng lồ điện toán đám mây của Mỹ, đồng thời ra mắt các mô hình suy luận mới sánh ngang với các hệ thống tiên tiến nhất của OpenAI. Công ty có trụ sở tại Paris đã tiết lộ Mistral Compute, một nền tảng cơ sở hạ tầng AI toàn diện được xây dựng với sự hợp tác của Nvidia, được thiết kế để cung cấp cho các doanh nghiệp và chính phủ châu Âu một giải pháp thay thế cho việc dựa vào các nhà cung cấp đám mây có trụ sở tại Hoa Kỳ như Amazon Web Services, Microsoft Azure và Google Cloud. Động thái này thể hiện một sự thay đổi chiến lược quan trọng đối với Mistral từ việc chỉ phát triển các mô hình AI sang kiểm soát toàn bộ ngăn xếp công nghệ. Arthur Mensch, Giám đốc điều hành và đồng sáng lập của Mistral AI, cho biết: “Việc chuyển sang cơ sở hạ tầng AI đánh dấu một bước chuyển đổi đối với Mistral AI, vì nó cho phép chúng tôi giải quyết một lĩnh vực quan trọng của chuỗi giá trị AI. Với sự thay đổi này, chúng tôi có trách nhiệm đảm bảo rằng các giải pháp của mình không chỉ thúc đẩy sự đổi mới và ứng dụng AI, mà còn duy trì quyền tự chủ về công nghệ của châu Âu và đóng góp vào vai trò dẫn đầu về tính bền vững”.

Cách Mistral xây dựng các mô hình suy luận có thể tư duy bằng mọi ngôn ngữ

Cùng với thông báo về cơ sở hạ tầng, Mistral đã công bố loạt mô hình suy luận Magistral — các hệ thống AI có khả năng tư duy logic từng bước tương tự như mô hình o1 của OpenAI và DeepSeek R1 của Trung Quốc. Nhưng Guillaume Lample, nhà khoa học trưởng của Mistral, cho biết cách tiếp cận của công ty khác với các đối thủ cạnh tranh ở những điểm quan trọng. Lample chia sẻ trong một cuộc phỏng vấn độc quyền: “Về cơ bản, chúng tôi đã làm mọi thứ từ đầu, bởi vì chúng tôi muốn học hỏi chuyên môn mà chúng tôi có, chẳng hạn như sự linh hoạt trong những gì chúng tôi làm. Chúng tôi thực sự đã cố gắng để thực sự, rất hiệu quả trên đường ống học tăng cường trực tuyến mạnh mẽ hơn”.

Không giống như các đối thủ cạnh tranh thường che giấu quy trình suy luận của họ, các mô hình của Mistral hiển thị toàn bộ chuỗi suy nghĩ của chúng cho người dùng — và quan trọng là bằng ngôn ngữ mẹ đẻ của người dùng thay vì mặc định là tiếng Anh. Lample giải thích: “Ở đây, chúng tôi có toàn bộ chuỗi suy nghĩ được cung cấp cho người dùng, nhưng bằng ngôn ngữ của chính họ, để họ thực sự có thể đọc qua, xem nó có hợp lý không”.

Công ty đã phát hành hai phiên bản: Magistral Small, một mô hình mã nguồn mở 24 tỷ tham số và Magistral Medium, một hệ thống độc quyền mạnh mẽ hơn có sẵn thông qua API của Mistral.

Tại sao các mô hình AI của Mistral lại có được những siêu năng lực bất ngờ trong quá trình đào tạo

Các mô hình đã chứng minh những khả năng đáng ngạc nhiên xuất hiện trong quá trình đào tạo. Đáng chú ý nhất, Magistral Medium vẫn giữ được khả năng suy luận đa phương thức — khả năng phân tích hình ảnh — mặc dù quá trình đào tạo chỉ tập trung vào các bài toán toán học và mã hóa dựa trên văn bản. Lample nói: “Một điều mà chúng tôi nhận ra, không hẳn là do nhầm lẫn, nhưng một điều mà chúng tôi hoàn toàn không ngờ tới, là nếu ở cuối quá trình đào tạo học tăng cường, bạn cắm lại bộ mã hóa hình ảnh ban đầu, thì bạn đột nhiên, kiểu như từ hư không, thấy mô hình có thể suy luận trên hình ảnh”.

Các mô hình cũng có được khả năng gọi hàm phức tạp, tự động thực hiện tìm kiếm trên internet nhiều bước và thực thi mã để trả lời các truy vấn phức tạp. Lample giải thích: “Những gì bạn sẽ thấy là một mô hình làm điều này, suy nghĩ, sau đó nhận ra, được rồi, thông tin này có thể được cập nhật. Hãy để tôi thực hiện tìm kiếm trên web. Nó sẽ tìm kiếm trên internet, và sau đó nó sẽ thực sự chuyển kết quả và nó sẽ đưa ra kết quả trên đó, và nó sẽ nói, có lẽ, có lẽ câu trả lời không có trong kết quả này. Hãy để tôi tìm kiếm lại”.

Hành vi này xuất hiện một cách tự nhiên mà không cần đào tạo cụ thể. Lample lưu ý: “Đó là điều mà dù có nên làm hay không, nhưng chúng tôi thấy rằng nó thực sự xảy ra một cách tự nhiên. Vì vậy, đó là một bất ngờ rất thú vị đối với chúng tôi”.

Đột phá kỹ thuật giúp quá trình đào tạo của Mistral nhanh hơn các đối thủ cạnh tranh

Đội ngũ kỹ thuật của Mistral đã vượt qua những thách thức kỹ thuật đáng kể để tạo ra cái mà Lample mô tả là một đột phá trong cơ sở hạ tầng đào tạo. Công ty đã phát triển một hệ thống “học tăng cường trực tuyến” cho phép các mô hình AI liên tục cải thiện trong khi tạo ra các phản hồi, thay vì dựa vào dữ liệu đào tạo có sẵn từ trước. Đổi mới quan trọng là đồng bộ hóa các bản cập nhật mô hình trên hàng trăm đơn vị xử lý đồ họa (GPU) trong thời gian thực. Lample giải thích: “Những gì chúng tôi đã làm là chúng tôi đã tìm ra cách để chỉ cần tháo mô hình thông qua GPU. Ý tôi là, từ GPU đến GPU”. Điều này cho phép hệ thống cập nhật trọng số mô hình trên các cụm GPU khác nhau trong vòng vài giây thay vì hàng giờ như thường lệ. Lample lưu ý: “Không có cơ sở hạ tầng nguồn mở nào có thể thực hiện việc này một cách đúng đắn. Thông thường, có rất nhiều nỗ lực nguồn mở để thực hiện việc này, nhưng nó cực kỳ chậm. Ở đây, chúng tôi tập trung rất nhiều vào hiệu quả”.

Quá trình đào tạo đã chứng tỏ nhanh hơn và rẻ hơn nhiều so với đào tạo trước thông thường. Lample nói: “Nó rẻ hơn nhiều so với đào tạo trước thông thường. Đào tạo trước là điều sẽ mất hàng tuần hoặc hàng tháng trên các GPU khác. Ở đây, chúng tôi không hề gần đến mức này. Nó giống như, tôi phụ thuộc vào số lượng người chúng tôi đưa vào việc này. Nhưng nó giống như, ít hơn một tuần”.

Nvidia cam kết cung cấp 18.000 chip cho nền độc lập AI của châu Âu

Nền tảng Mistral Compute sẽ chạy trên 18.000 chip Grace Blackwell mới nhất của Nvidia, ban đầu được đặt trong một trung tâm dữ liệu ở Essonne, Pháp, với kế hoạch mở rộng trên khắp châu Âu. Giám đốc điều hành Nvidia, Jensen Huang, mô tả sự hợp tác này là rất quan trọng đối với nền độc lập công nghệ của châu Âu. Huang phát biểu tại một thông báo chung ở Paris: “Mọi quốc gia nên xây dựng AI cho quốc gia của riêng mình, tại quốc gia của họ. Với Mistral AI, chúng tôi đang phát triển các mô hình và nhà máy AI đóng vai trò là nền tảng có chủ quyền cho các doanh nghiệp trên khắp châu Âu để mở rộng quy mô trí tuệ trên các ngành”.

Huang dự đoán rằng năng lực tính toán AI của châu Âu sẽ tăng gấp mười lần trong hai năm tới, với hơn 20 “nhà máy AI” được lên kế hoạch trên khắp lục địa. Một số cơ sở này sẽ có công suất hơn một gigawatt, có khả năng nằm trong số các trung tâm dữ liệu lớn nhất thế giới. Sự hợp tác này mở rộng ra ngoài cơ sở hạ tầng để bao gồm công việc của Nvidia với các công ty AI châu Âu khác và Perplexity, công ty tìm kiếm, để phát triển các mô hình suy luận bằng nhiều ngôn ngữ châu Âu khác nhau, nơi dữ liệu đào tạo thường bị hạn chế.

Cách Mistral lên kế hoạch giải quyết các vấn đề về môi trường và chủ quyền của AI

Mistral Compute giải quyết hai mối lo ngại lớn về phát triển AI: tác động môi trường và chủ quyền dữ liệu. Nền tảng này đảm bảo rằng khách hàng châu Âu có thể giữ thông tin của họ trong biên giới EU và dưới sự quản lý của châu Âu. Công ty đã hợp tác với cơ quan quốc gia về chuyển đổi sinh thái của Pháp và Carbone 4, một công ty tư vấn về khí hậu hàng đầu, để đánh giá và giảm thiểu lượng khí thải carbon của các mô hình AI của mình trong suốt vòng đời của chúng. Mistral có kế hoạch cung cấp năng lượng cho các trung tâm dữ liệu của mình bằng các nguồn năng lượng khử carbon. Công ty tuyên bố trong thông báo của mình: “Bằng cách chọn châu Âu làm địa điểm cho các địa điểm của mình, chúng tôi tự cho mình khả năng hưởng lợi từ các nguồn năng lượng khử carbon phần lớn”.

Lợi thế về tốc độ mang lại cho các mô hình suy luận của Mistral một lợi thế thiết thực

Thử nghiệm ban đầu cho thấy các mô hình suy luận của Mistral mang lại hiệu suất cạnh tranh đồng thời giải quyết một lời chỉ trích phổ biến đối với các hệ thống hiện có — tốc độ. Các mô hình suy luận hiện tại từ OpenAI và các công ty khác có thể mất vài phút để trả lời các truy vấn phức tạp, hạn chế tiện ích thực tế của chúng. Lample lưu ý: “Một trong những điều mà mọi người thường không thích ở mô hình suy luận này là mặc dù nó thông minh, nhưng đôi khi nó tốn rất nhiều thời gian. Ở đây, bạn thực sự thấy kết quả chỉ trong vài giây, đôi khi ít hơn năm giây, đôi khi thậm chí còn ít hơn thế. Và nó thay đổi trải nghiệm”.

Lợi thế về tốc độ có thể chứng tỏ rất quan trọng đối với việc áp dụng trong kinh doanh, nơi việc chờ đợi phản hồi AI trong vài phút sẽ tạo ra tắc nghẽn quy trình làm việc.

Cược cơ sở hạ tầng của Mistral có ý nghĩa gì đối với cạnh tranh AI toàn cầu

Việc Mistral chuyển sang cơ sở hạ tầng đặt công ty vào sự cạnh tranh trực tiếp với các gã khổng lồ công nghệ vốn đã thống trị thị trường điện toán đám mây. Amazon Web Services, Microsoft Azure và Google Cloud hiện kiểm soát phần lớn cơ sở hạ tầng đám mây trên toàn cầu, trong khi những người chơi mới hơn như CoreWeave đã đạt được chỗ đứng đặc biệt trong khối lượng công việc AI. Cách tiếp cận của công ty khác với các đối thủ cạnh tranh bằng cách cung cấp một giải pháp hoàn chỉnh, tích hợp theo chiều dọc — từ cơ sở hạ tầng phần cứng đến mô hình AI đến dịch vụ phần mềm. Điều này bao gồm Mistral AI Studio dành cho nhà phát triển, Le Chat để tăng năng suất doanh nghiệp và Mistral Code để hỗ trợ lập trình. Các nhà phân tích trong ngành coi chiến lược của Mistral là một phần của xu hướng rộng lớn hơn hướng tới phát triển AI khu vực. Huang nhận xét: “Châu Âu cần khẩn trương mở rộng cơ sở hạ tầng AI của mình nếu muốn duy trì tính cạnh tranh trên toàn cầu”, lặp lại những lo ngại do các nhà hoạch định chính sách châu Âu bày tỏ.

Thông báo này được đưa ra khi các chính phủ châu Âu ngày càng lo lắng về sự phụ thuộc của họ vào các công ty công nghệ Mỹ đối với cơ sở hạ tầng AI quan trọng. Liên minh châu Âu đã cam kết 20 tỷ euro để xây dựng các “nhà máy gigafactory” AI trên khắp lục địa và sự hợp tác của Mistral với Nvidia có thể giúp đẩy nhanh những kế hoạch đó. Thông báo kép của Mistral về khả năng cơ sở hạ tầng và mô hình báo hiệu tham vọng của công ty trở thành một nền tảng AI toàn diện thay vì chỉ là một nhà cung cấp mô hình khác. Với sự hậu thuẫn từ Microsoft và các nhà đầu tư khác, công ty đã huy động được hơn 1 tỷ đô la và tiếp tục tìm kiếm thêm nguồn tài trợ để hỗ trợ phạm vi mở rộng của mình. Nhưng Lample còn thấy những khả năng lớn hơn phía trước cho các mô hình suy luận. Anh nói: “Tôi nghĩ khi tôi nhìn vào sự tiến bộ bên trong và tôi nghĩ về một số tiêu chuẩn, mô hình đã đạt được độ chính xác cộng 5% mỗi tuần trong khoảng sáu tuần. Vì vậy, nó đang cải thiện rất nhanh, có rất nhiều, rất nhiều, ý tôi là hàng tấn những ý tưởng nhỏ mà bạn có thể nghĩ ra sẽ cải thiện hiệu suất”.

Sự thành công của thách thức châu Âu này đối với sự thống trị AI của Mỹ cuối cùng có thể phụ thuộc vào việc khách hàng có coi trọng chủ quyền và tính bền vững đủ để chuyển từ các nhà cung cấp đã thành danh hay không. Ít nhất là hiện tại, họ có một sự lựa chọn.

Thông tin chi tiết hàng ngày về các trường hợp sử dụng kinh doanh với VB Daily

Nếu bạn muốn gây ấn tượng với sếp của mình, VB Daily sẽ giúp bạn. Chúng tôi cung cấp cho bạn thông tin nội bộ về những gì các công ty đang làm với AI tạo sinh, từ những thay đổi về quy định đến triển khai thực tế, để bạn có thể chia sẻ thông tin chi tiết để có ROI tối đa. Đăng ký ngay Đọc Chính sách quyền riêng tư của chúng tôi Cảm ơn bạn đã đăng ký. Xem thêm bản tin VB tại đây. Đã xảy ra lỗi.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *