$96418.721981 USD

-2.05%

ethereum

$2687.739314 USD

-2.74%

xrp

$2.588011 USD

-3.00%

tether

$0.999825 USD

-0.04%

bnb

$656.326573 USD

0.40%

solana

$171.386564 USD

-2.54%

usd-coin

$1.000043 USD

0.01%

dogecoin

$0.244077 USD

-3.80%

cardano

$0.767310 USD

-3.77%

tron

$0.237868 USD

-4.90%

chainlink

$17.505561 USD

-4.59%

sui

$3.344930 USD

-4.57%

avalanche

$24.939290 USD

-1.00%

stellar

$0.327623 USD

-3.46%

litecoin

$129.677981 USD

-3.20%

加密貨幣新聞文章

開放人工智慧語言模型挑戰可及性和透明度的界限

2024/04/22 23:30

Mistral 和 Meta 最近宣布並開源了他們的新模型 Mixtral 8x22B 和 LLama 3，可與 GPT-4、Gemini Pro 和 Claude 3 等模型相媲美。雖然這些模型提供了對資料的更好控制和對特定需求的適應性，但人們擔心它們可用於潛在的惡意目的，以及它們的開發和部署中的透明度和責任感。隨著研究不斷突破法學碩士能力的界限，關於開源人工智慧的優點和風險的討論將會繼續。

Nouveaux modèles de langage ouverts remettant en question les limites de l'IA

新的開放語言模式挑戰人工智慧的極限

Dans le paysage de l'intelligence artificielle (IA) générative, les récentes annonces de Mistral et de Meta ont suscité une onde de choc. Les deux entreprises ont présenté leurs nouveaux modèles révolutionnaires à grande échelle - Mixtral 8x22B et Llama 3 - accessibles en open source, marquant ainsi un tournant potentiel dans l'accessibilité et les débats sur l'IA ouverte.

在生成人工智慧 (AI) 領域，Mistral 和 Meta 最近的聲明引起了震動。兩家公司都展示了其革命性的新型大型模型——Mixtral 8x22B 和 Llama 3——它們都是開源的，標誌著可訪問性和開放人工智慧辯論的潛在轉折點。

Mistral défie les modèles propriétaires avec Mixtral 8x22B

Mistral 用 Mixtral 8x22B 挑戰專有模型

Mistral AI, une pionnière française de l'IA, a dévoilé Mixtral 8x22B, un LLM (Language Large Model) massif de 291 Go, accessible via un torrent en raison de sa taille imposante. Ce modèle se distingue par son approche innovante "Sparse Mixture of Experts" (SMoE), qui combine de petits modèles spécialisés avec un mécanisme dynamique de sélection de modèles. Cela permet à Mixtral 8x22B d'activer uniquement une fraction (39 milliards) de ses 141 milliards de paramètres, offrant ainsi la puissance d'un grand modèle avec une efficacité accrue.

法國人工智慧先驅 Mistral AI 推出了 Mixtral 8x22B，這是一個巨大的 291 GB LLM（語言大模型），由於其巨大的尺寸，可以透過 torrent 存取。該模型因其創新的「稀疏專家混合」（SMoE）方法而脫穎而出，該方法將小型專業模型與動態模型選擇機制相結合。這使得 Mixtral 8x22B 只能啟動其 1,410 億個參數中的一小部分（390 億個），從而以更高的效率提供大型模型的強大功能。

Mixtral 8x22B maîtrise plusieurs langues, notamment l'anglais, le français, l'italien, l'allemand et l'espagnol, et offre des capacités avancées de programmation (génération de code) et de raisonnement mathématique. Il dispose d'une fenêtre contextuelle de 64 000 jetons, permettant des conversations plus longues et plus cohérentes.

Mixtral 8x22B 精通多種語言，包括英語、法語、義大利語、德語和西班牙語，並提供高級程式設計（程式碼產生）和數學推理功能。它有 64,000 個令牌的彈出窗口，允許更長、更連貫的對話。

Meta fait progresser les LLM avec Llama 3

Meta 透過 Llama 3 推進法學碩士課程

Meta, le géant des réseaux sociaux, est entré en lice avec Llama 3, la dernière version de son populaire LLM open source. Llama 3 se démarque par sa conception multimodale, lui permettant d'analyser et de comprendre des images. Meta a également retravaillé les phases de pré-entraînement, post-entraînement et de tokenisation, avec des techniques telles que le filtrage des données, l'attention groupée aux requêtes et le réentraînement sur 15 000 milliards de jetons.

社群媒體巨頭 Meta 已經加入了 Llama 3 的競爭，Llama 3 是其流行的開源 LLM 的最新版本。 Llama 3 因其多模式設計而脫穎而出，使其能夠分析和理解影像。 Meta 還使用資料過濾、查詢叢集和對 15 兆個代幣進行再訓練等技術重新設計了預訓練、訓練後和代幣化階段。

Le résultat est un modèle plus fiable, moins sujet aux hallucinations et surpassant les performances de Claude 3 et de Gemini Pro 1.5 d'OpenAI, du moins en anglais, selon les benchmarks de Meta. Llama 3 est disponible en versions "8B" et "70B", et une version "400B" plus ambitieuse est en cours de développement. Meta a également annoncé des partenariats avec des fournisseurs de cloud majeurs, notamment Google, Amazon et Microsoft, pour rendre Llama 3 largement accessible.

根據 Meta 的基準測試，結果是一個更可靠的模型，不易產生幻覺，並且至少在英語方面優於 OpenAI 的 Claude 3 和 Gemini Pro 1.5。 Llama 3 有「8B」和「70B」版本，更雄心勃勃的「400B」版本正在開發中。 Meta 也宣布與Google、亞馬遜和微軟等主要雲端供應商合作，以使 Llama 3 能夠廣泛使用。

Le dilemme de l'IA open source

開源人工智慧的困境

Les modèles open source comme Mixtral 8x22B et Llama 3 ont ravivé le débat sur l'IA open source. Bien que certains affirment que la publication des poids du modèle et du code d'inférence suffit à garantir l'ouverture, d'autres soutiennent qu'un accès à la base de données d'entraînement et au pipeline d'apprentissage est essentiel pour une véritable transparence.

Mixtral 8x22B 和 Llama 3 等開源模型重新引發了開源 AI 爭論。儘管有些人認為發布模型權重和推理程式碼足以確保開放性，但其他人則認為存取訓練資料庫和學習管道對於真正的透明度至關重要。

Les partisans de l'IA open source soutiennent qu'elle favorise la transparence, permet aux entreprises d'adapter les IA à leurs besoins spécifiques et réduit les risques associés aux modèles propriétaires. Les détracteurs, quant à eux, expriment des inquiétudes quant à l'utilisation potentiellement malveillante de ces LLM puissants et à la diffusion de fausses informations et de propagande.

開源人工智慧的支持者認為，它可以提高透明度，允許公司根據自己的特定需求客製化人工智慧，並降低與專有模型相關的風險。同時，批評者對這些強大的法學碩士的潛在惡意使用以及錯誤訊息和宣傳的傳播表示擔憂。

L'avenir de l'IA reste incertain

人工智慧的未來仍然不確定

Alors que les modèles de langage continuent de gagner en sophistication, la R&D se poursuit à un rythme effréné. Les LLM ont encore beaucoup à offrir, mais des questions éthiques et sociétales complexes restent à résoudre. Les débats sur les risques et les avantages de l'IA open source vont probablement se poursuivre, influençant l'avenir du développement et du déploiement de l'IA.

隨著語言模型的不斷複雜化，研發繼續以驚人的速度進行。法學碩士仍然可以提供很多東西，但複雜的道德和社會問題仍有待解決。關於開源人工智慧的風險和效益的爭論可能會持續下去，影響人工智慧開發和部署的未來。

免責聲明:info@kdj.com

所提供的資訊並非交易建議。 kDJ.com對任何基於本文提供的資訊進行的投資不承擔任何責任。加密貨幣波動性較大，建議您充分研究後謹慎投資！

如果您認為本網站使用的內容侵犯了您的版權，請立即聯絡我們（info@kdj.com），我們將及時刪除。

2025年02月23日其他文章發表於