Mistral ra mắt nền tảng AI đám mây châu Âu cạnh tranh với AWS và Azure, được Microsoft hậu thuẫn | VentureBeat

Tham gia sự kiện được các nhà lãnh đạo doanh nghiệp tin tưởng trong gần hai thập kỷ. VB Transform tập hợp những người xây dựng chiến lược AI doanh nghiệp thực sự. Tìm hiểu thêm Mistral AI, startup trí tuệ nhân tạo của Pháp, hôm thứ Tư đã công bố một đợt mở rộng lớn sang cơ sở hạ tầng AI, định vị công ty là câu trả lời của châu Âu cho những gã khổng lồ điện toán đám mây của Mỹ, đồng thời công bố các mô hình suy luận mới cạnh tranh với các hệ thống tiên tiến nhất của OpenAI. Công ty có trụ sở tại Paris đã tiết lộ Mistral Compute, một nền tảng cơ sở hạ tầng AI toàn diện được xây dựng với sự hợp tác của Nvidia, được thiết kế để cung cấp cho các doanh nghiệp và chính phủ châu Âu một giải pháp thay thế cho việc dựa vào các nhà cung cấp dịch vụ đám mây có trụ sở tại Hoa Kỳ như Amazon Web Services, Microsoft Azure và Google Cloud. Động thái này thể hiện một sự thay đổi chiến lược quan trọng đối với Mistral từ việc thuần túy phát triển các mô hình AI sang kiểm soát toàn bộ ngăn xếp công nghệ. Arthur Mensch, Giám đốc điều hành và đồng sáng lập của Mistral AI, cho biết: “Việc chuyển sang cơ sở hạ tầng AI đánh dấu một bước chuyển đổi đối với Mistral AI, vì nó cho phép chúng tôi giải quyết một lĩnh vực quan trọng của chuỗi giá trị AI. “Với sự thay đổi này, chúng tôi có trách nhiệm đảm bảo rằng các giải pháp của chúng tôi không chỉ thúc đẩy sự đổi mới và ứng dụng AI, mà còn duy trì quyền tự chủ về công nghệ của châu Âu và đóng góp vào vai trò lãnh đạo về tính bền vững.”

Cách Mistral xây dựng các mô hình suy luận có thể suy nghĩ bằng mọi ngôn ngữ

Cùng với thông báo về cơ sở hạ tầng, Mistral đã công bố loạt mô hình suy luận Magistral của mình — các hệ thống AI có khả năng tư duy logic từng bước tương tự như mô hình o1 của OpenAI và DeepSeek R1 của Trung Quốc. Nhưng Guillaume Lample, nhà khoa học trưởng của Mistral, cho biết cách tiếp cận của công ty khác với các đối thủ cạnh tranh ở những điểm quan trọng. Lample nói với tôi trong một cuộc phỏng vấn độc quyền: “Về cơ bản, chúng tôi đã làm mọi thứ từ đầu, bởi vì chúng tôi muốn học hỏi chuyên môn mà chúng tôi có, chẳng hạn như tính linh hoạt trong những gì chúng tôi làm. “Chúng tôi thực sự đã cố gắng trở thành một đường ống học tăng cường trực tuyến mạnh mẽ, thực sự rất hiệu quả.”

Không giống như các đối thủ cạnh tranh thường che giấu quy trình suy luận của họ, các mô hình của Mistral hiển thị toàn bộ chuỗi suy nghĩ của họ cho người dùng — và quan trọng là bằng ngôn ngữ mẹ đẻ của người dùng thay vì mặc định là tiếng Anh. Lample giải thích: “Ở đây, chúng tôi có toàn bộ chuỗi suy nghĩ được cung cấp cho người dùng, nhưng bằng ngôn ngữ của riêng họ, để họ thực sự có thể đọc qua, xem liệu nó có ý nghĩa hay không”.

Công ty đã phát hành hai phiên bản: Magistral Small, một mô hình nguồn mở 24 tỷ tham số và Magistral Medium, một hệ thống độc quyền mạnh mẽ hơn có sẵn thông qua API của Mistral.

Tại sao các mô hình AI của Mistral lại có được siêu năng lực bất ngờ trong quá trình đào tạo

Các mô hình đã thể hiện những khả năng đáng ngạc nhiên xuất hiện trong quá trình đào tạo. Đáng chú ý nhất, Magistral Medium vẫn giữ được khả năng suy luận đa phương thức — khả năng phân tích hình ảnh — mặc dù quá trình đào tạo chỉ tập trung vào các vấn đề toán học và mã hóa dựa trên văn bản. Lample nói: “Một điều mà chúng tôi nhận ra, không hẳn là do nhầm lẫn, mà là điều mà chúng tôi hoàn toàn không ngờ tới, là nếu vào cuối quá trình đào tạo tăng cường, bạn cắm lại bộ mã hóa tầm nhìn ban đầu, thì bạn đột nhiên, một cách khá bất ngờ, thấy mô hình có thể thực hiện suy luận trên hình ảnh”.

Các mô hình cũng có được khả năng gọi hàm phức tạp, tự động thực hiện các tìm kiếm trên internet và thực thi mã nhiều bước để trả lời các truy vấn phức tạp. Lample giải thích: “Những gì bạn sẽ thấy là một mô hình đang làm điều này, suy nghĩ, sau đó nhận ra, được rồi, thông tin này có thể được cập nhật. Hãy để tôi thực hiện một tìm kiếm trên web. “Nó sẽ tìm kiếm trên internet, và sau đó nó sẽ thực sự chuyển kết quả và nó sẽ dẫn đến nó, và nó sẽ nói, có lẽ, có lẽ câu trả lời không có trong kết quả này. Hãy để tôi tìm kiếm lại.”

Hành vi này xuất hiện một cách tự nhiên mà không cần đào tạo cụ thể. Lample lưu ý: “Đó là điều mà dù có hay không nên làm tiếp theo, nhưng chúng tôi thấy rằng nó thực sự xảy ra một cách tự nhiên. Vì vậy, đó là một bất ngờ rất thú vị đối với chúng tôi.”

Đột phá kỹ thuật giúp quá trình đào tạo của Mistral nhanh hơn các đối thủ cạnh tranh

Đội ngũ kỹ thuật của Mistral đã vượt qua những thách thức kỹ thuật đáng kể để tạo ra thứ mà Lample mô tả là một bước đột phá trong cơ sở hạ tầng đào tạo. Công ty đã phát triển một hệ thống “học tăng cường trực tuyến” cho phép các mô hình AI liên tục cải thiện trong khi tạo ra phản hồi, thay vì dựa vào dữ liệu đào tạo có sẵn từ trước.

Sự đổi mới quan trọng liên quan đến việc đồng bộ hóa các bản cập nhật mô hình trên hàng trăm đơn vị xử lý đồ họa (GPU) trong thời gian thực. Lample giải thích: “Những gì chúng tôi đã làm là chúng tôi đã tìm ra cách để chỉ cần tháo mô hình thông qua GPU. Ý tôi là, từ GPU sang GPU. Điều này cho phép hệ thống cập nhật trọng số mô hình trên các cụm GPU khác nhau trong vòng vài giây thay vì hàng giờ thường được yêu cầu. Lample lưu ý: “Không có cơ sở hạ tầng nguồn mở nào sẽ thực hiện việc này đúng cách. “Thông thường, có rất nhiều nỗ lực nguồn mở để làm điều này, nhưng nó cực kỳ chậm. Ở đây, chúng tôi tập trung rất nhiều vào hiệu quả.”

Quá trình đào tạo đã chứng minh nhanh hơn và rẻ hơn nhiều so với đào tạo trước truyền thống. Lample nói: “Nó rẻ hơn nhiều so với đào tạo trước thông thường. Đào tạo trước là việc mất hàng tuần hoặc hàng tháng trên các GPU khác. Ở đây, chúng tôi không hề gần điều này. Nó giống như, tôi phụ thuộc vào việc chúng tôi đặt bao nhiêu người vào việc này. Nhưng nó giống như, nó giống như, ít hơn một tuần.”

Nvidia cam kết 18.000 chip cho nền độc lập AI của châu Âu

Nền tảng Mistral Compute sẽ chạy trên 18.000 chip Grace Blackwell mới nhất của Nvidia, ban đầu được đặt trong một trung tâm dữ liệu ở Essonne, Pháp, với kế hoạch mở rộng trên khắp châu Âu. Giám đốc điều hành Nvidia Jensen Huang mô tả sự hợp tác này là rất quan trọng đối với nền độc lập công nghệ của châu Âu. Huang cho biết tại một thông báo chung ở Paris: “Mọi quốc gia nên xây dựng AI cho quốc gia của riêng họ, tại quốc gia của họ. “Với Mistral AI, chúng tôi đang phát triển các mô hình và nhà máy AI đóng vai trò là nền tảng chủ quyền cho các doanh nghiệp trên khắp châu Âu để mở rộng quy mô trí tuệ trên các ngành công nghiệp.”

Huang dự kiến năng lực điện toán AI của châu Âu sẽ tăng gấp mười lần trong hai năm tới, với hơn 20 “nhà máy AI” được lên kế hoạch trên khắp lục địa. Một số cơ sở này sẽ có công suất hơn một gigawatt, có khả năng xếp hạng trong số các trung tâm dữ liệu lớn nhất thế giới.

Sự hợp tác này mở rộng ra ngoài cơ sở hạ tầng để bao gồm công việc của Nvidia với các công ty AI châu Âu khác và Perplexity, công ty tìm kiếm, để phát triển các mô hình suy luận bằng nhiều ngôn ngữ châu Âu khác nhau, nơi dữ liệu đào tạo thường bị hạn chế.

Cách Mistral lên kế hoạch giải quyết các vấn đề về môi trường và chủ quyền của AI

Mistral Compute giải quyết hai mối lo ngại chính về phát triển AI: tác động môi trường và chủ quyền dữ liệu. Nền tảng đảm bảo rằng khách hàng châu Âu có thể giữ thông tin của họ trong biên giới EU và dưới sự quản lý của châu Âu. Công ty đã hợp tác với cơ quan chuyển đổi sinh thái quốc gia của Pháp và Carbone 4, một công ty tư vấn về khí hậu hàng đầu, để đánh giá và giảm thiểu lượng khí thải carbon của các mô hình AI của mình trong suốt vòng đời của chúng.

Mistral có kế hoạch cung cấp năng lượng cho các trung tâm dữ liệu của mình bằng các nguồn năng lượng khử carbon. Công ty tuyên bố trong thông báo của mình: “Bằng cách chọn châu Âu làm địa điểm cho các địa điểm của mình, chúng tôi tự trao cho mình khả năng hưởng lợi từ các nguồn năng lượng khử carbon phần lớn”.

Lợi thế tốc độ mang lại cho các mô hình suy luận của Mistral một lợi thế thực tế

Các thử nghiệm ban đầu cho thấy các mô hình suy luận của Mistral mang lại hiệu suất cạnh tranh đồng thời giải quyết một lời chỉ trích phổ biến đối với các hệ thống hiện có — tốc độ. Các mô hình suy luận hiện tại từ OpenAI và các công ty khác có thể mất vài phút để phản hồi các truy vấn phức tạp, hạn chế tiện ích thực tế của chúng.

Lample lưu ý: “Một trong những điều mà mọi người thường không thích về mô hình suy luận này là mặc dù nó thông minh, nhưng đôi khi nó tốn rất nhiều thời gian. “Ở đây, bạn thực sự thấy đầu ra chỉ trong vài giây, đôi khi ít hơn năm giây, đôi khi thậm chí còn ít hơn. Và nó thay đổi trải nghiệm.”

Lợi thế về tốc độ có thể chứng tỏ rất quan trọng đối với việc áp dụng kinh doanh, nơi việc chờ đợi phản hồi của AI trong vài phút tạo ra tắc nghẽn quy trình làm việc.

Cược cơ sở hạ tầng của Mistral có ý nghĩa gì đối với cạnh tranh AI toàn cầu

Việc Mistral chuyển sang cơ sở hạ tầng đặt nó vào sự cạnh tranh trực tiếp với các gã khổng lồ công nghệ đã thống trị thị trường điện toán đám mây. Amazon Web Services, Microsoft Azure và Google Cloud hiện kiểm soát phần lớn cơ sở hạ tầng đám mây trên toàn cầu, trong khi những người chơi mới hơn như CoreWeave đã có được chỗ đứng cụ thể trong khối lượng công việc AI.

Cách tiếp cận của công ty khác với các đối thủ cạnh tranh bằng cách cung cấp một giải pháp tích hợp theo chiều dọc hoàn chỉnh — từ cơ sở hạ tầng phần cứng đến mô hình AI đến dịch vụ phần mềm. Điều này bao gồm Mistral AI Studio cho nhà phát triển, Le Chat cho năng suất doanh nghiệp và Mistral Code để hỗ trợ lập trình.

Các nhà phân tích trong ngành coi chiến lược của Mistral là một phần của xu hướng rộng lớn hơn đối với phát triển AI khu vực. Huang nhận xét: “Châu Âu cần khẩn trương mở rộng cơ sở hạ tầng AI nếu muốn duy trì tính cạnh tranh trên toàn cầu”, lặp lại những lo ngại mà các nhà hoạch định chính sách châu Âu đã bày tỏ.

Thông báo này được đưa ra khi các chính phủ châu Âu ngày càng lo lắng về sự phụ thuộc của họ vào các công ty công nghệ Mỹ đối với cơ sở hạ tầng AI quan trọng. Liên minh châu Âu đã cam kết 20 tỷ euro để xây dựng các “gigafactory” AI trên khắp lục địa và sự hợp tác của Mistral với Nvidia có thể giúp đẩy nhanh những kế hoạch đó.

Thông báo kép của Mistral về khả năng cơ sở hạ tầng và mô hình báo hiệu tham vọng của công ty trở thành một nền tảng AI toàn diện hơn là chỉ một nhà cung cấp mô hình khác. Với sự hỗ trợ từ Microsoft và các nhà đầu tư khác, công ty đã huy động được hơn 1 tỷ đô la và tiếp tục tìm kiếm nguồn vốn bổ sung để hỗ trợ phạm vi mở rộng của mình.

Nhưng Lample thấy thậm chí còn nhiều khả năng lớn hơn phía trước cho các mô hình suy luận. Ông nói: “Tôi nghĩ khi tôi nhìn vào tiến trình nội bộ và tôi nghĩ về một số điểm chuẩn, mô hình đã đạt được độ chính xác cộng 5% mỗi tuần trong khoảng sáu tuần. “Vì vậy, nó đang cải thiện rất nhanh, có rất nhiều, ý tôi là, hàng tấn, bạn biết đấy, những ý tưởng nhỏ mà bạn có thể nghĩ ra sẽ cải thiện hiệu suất.”

Sự thành công của thách thức châu Âu này đối với sự thống trị AI của Mỹ cuối cùng có thể phụ thuộc vào việc khách hàng có coi trọng chủ quyền và tính bền vững đủ để chuyển từ các nhà cung cấp đã thành lập hay không. Ít nhất là hiện tại, họ có một sự lựa chọn.

Thông tin chi tiết hàng ngày về các trường hợp sử dụng kinh doanh với VB Daily

Nếu bạn muốn gây ấn tượng với sếp của mình, VB Daily sẽ giúp bạn. Chúng tôi cung cấp cho bạn thông tin nội bộ về những gì các công ty đang làm với AI tạo sinh, từ những thay đổi về quy định đến triển khai thực tế, để bạn có thể chia sẻ thông tin chi tiết để có ROI tối đa. Đăng ký ngay Đọc Chính sách bảo mật của chúng tôi Cảm ơn bạn đã đăng ký. Xem thêm bản tin VB tại đây. Đã xảy ra lỗi.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *