$96333.736218 USD

-0.12%

ethereum

$2794.212975 USD

3.83%

xrp

$2.567236 USD

-0.92%

tether

$1.000070 USD

0.02%

bnb

$665.513425 USD

1.27%

solana

$171.604422 USD

-0.12%

usd-coin

$0.999978 USD

0.00%

dogecoin

$0.244805 USD

0.18%

cardano

$0.774995 USD

0.71%

tron

$0.242596 USD

2.02%

chainlink

$17.899842 USD

2.05%

avalanche

$25.609807 USD

2.64%

sui

$3.385756 USD

1.02%

stellar

$0.332895 USD

1.57%

litecoin

$127.073849 USD

-2.04%

加密货币新闻

开放人工智能语言模型挑战可访问性和透明度的界限

2024/04/22 23:30

Mistral 和 Meta 最近宣布并开源了他们的新模型 Mixtral 8x22B 和 LLama 3，可与 GPT-4、Gemini Pro 和 Claude 3 等模型相媲美。这些版本重新引发了关于开源人工智能的风险和定义的争论。虽然这些模型提供了对数据的更好控制和对特定需求的适应性，但人们担心它们可用于潜在的恶意目的，以及它们的开发和部署中的透明度和责任感。随着研究不断突破法学硕士能力的界限，关于开源人工智能的优点和风险的讨论将会继续。

Nouveaux modèles de langage ouverts remettant en question les limites de l'IA

新的开放语言模型挑战人工智能的极限

Dans le paysage de l'intelligence artificielle (IA) générative, les récentes annonces de Mistral et de Meta ont suscité une onde de choc. Les deux entreprises ont présenté leurs nouveaux modèles révolutionnaires à grande échelle - Mixtral 8x22B et Llama 3 - accessibles en open source, marquant ainsi un tournant potentiel dans l'accessibilité et les débats sur l'IA ouverte.

在生成人工智能 (AI) 领域，Mistral 和 Meta 最近的声明引起了震动。两家公司都展示了其革命性的新型大型模型——Mixtral 8x22B 和 Llama 3——它们都是开源的，标志着可访问性和开放人工智能辩论的潜在转折点。

Mistral défie les modèles propriétaires avec Mixtral 8x22B

Mistral 用 Mixtral 8x22B 挑战专有模型

Mistral AI, une pionnière française de l'IA, a dévoilé Mixtral 8x22B, un LLM (Language Large Model) massif de 291 Go, accessible via un torrent en raison de sa taille imposante. Ce modèle se distingue par son approche innovante "Sparse Mixture of Experts" (SMoE), qui combine de petits modèles spécialisés avec un mécanisme dynamique de sélection de modèles. Cela permet à Mixtral 8x22B d'activer uniquement une fraction (39 milliards) de ses 141 milliards de paramètres, offrant ainsi la puissance d'un grand modèle avec une efficacité accrue.

法国人工智能先驱 Mistral AI 推出了 Mixtral 8x22B，这是一个巨大的 291 GB LLM（语言大模型），由于其巨大的尺寸，可以通过 torrent 访问。该模型因其创新的“稀疏专家混合”（SMoE）方法而脱颖而出，该方法将小型专业模型与动态模型选择机制相结合。这使得 Mixtral 8x22B 只能激活其 1410 亿个参数中的一小部分（390 亿个），从而以更高的效率提供大型模型的强大功能。

Mixtral 8x22B maîtrise plusieurs langues, notamment l'anglais, le français, l'italien, l'allemand et l'espagnol, et offre des capacités avancées de programmation (génération de code) et de raisonnement mathématique. Il dispose d'une fenêtre contextuelle de 64 000 jetons, permettant des conversations plus longues et plus cohérentes.

Mixtral 8x22B 精通多种语言，包括英语、法语、意大利语、德语和西班牙语，并提供高级编程（代码生成）和数学推理功能。它有 64,000 个令牌的弹出窗口，允许更长、更连贯的对话。

Meta fait progresser les LLM avec Llama 3

Meta 通过 Llama 3 推进法学硕士课程

Meta, le géant des réseaux sociaux, est entré en lice avec Llama 3, la dernière version de son populaire LLM open source. Llama 3 se démarque par sa conception multimodale, lui permettant d'analyser et de comprendre des images. Meta a également retravaillé les phases de pré-entraînement, post-entraînement et de tokenisation, avec des techniques telles que le filtrage des données, l'attention groupée aux requêtes et le réentraînement sur 15 000 milliards de jetons.

社交媒体巨头 Meta 已经加入了 Llama 3 的竞争，Llama 3 是其流行的开源 LLM 的最新版本。 Llama 3 因其多模式设计而脱颖而出，使其能够分析和理解图像。 Meta 还使用数据过滤、查询集群和对 15 万亿个令牌进行再训练等技术重新设计了预训练、训练后和令牌化阶段。

Le résultat est un modèle plus fiable, moins sujet aux hallucinations et surpassant les performances de Claude 3 et de Gemini Pro 1.5 d'OpenAI, du moins en anglais, selon les benchmarks de Meta. Llama 3 est disponible en versions "8B" et "70B", et une version "400B" plus ambitieuse est en cours de développement. Meta a également annoncé des partenariats avec des fournisseurs de cloud majeurs, notamment Google, Amazon et Microsoft, pour rendre Llama 3 largement accessible.

根据 Meta 的基准测试，结果是一个更可靠的模型，不易产生幻觉，并且至少在英语方面优于 OpenAI 的 Claude 3 和 Gemini Pro 1.5。 Llama 3 有“8B”和“70B”版本，更雄心勃勃的“400B”版本正在开发中。 Meta 还宣布与谷歌、亚马逊和微软等主要云提供商合作，以使 Llama 3 能够广泛使用。

Le dilemme de l'IA open source

开源人工智能的困境

Les modèles open source comme Mixtral 8x22B et Llama 3 ont ravivé le débat sur l'IA open source. Bien que certains affirment que la publication des poids du modèle et du code d'inférence suffit à garantir l'ouverture, d'autres soutiennent qu'un accès à la base de données d'entraînement et au pipeline d'apprentissage est essentiel pour une véritable transparence.

Mixtral 8x22B 和 Llama 3 等开源模型重新引发了开源 AI 争论。尽管一些人认为发布模型权重和推理代码足以确保开放性，但另一些人则认为访问训练数据库和学习管道对于真正的透明度至关重要。

Les partisans de l'IA open source soutiennent qu'elle favorise la transparence, permet aux entreprises d'adapter les IA à leurs besoins spécifiques et réduit les risques associés aux modèles propriétaires. Les détracteurs, quant à eux, expriment des inquiétudes quant à l'utilisation potentiellement malveillante de ces LLM puissants et à la diffusion de fausses informations et de propagande.

开源人工智能的支持者认为，它可以提高透明度，允许公司根据自己的特定需求定制人工智能，并降低与专有模型相关的风险。与此同时，批评者对这些强大的法学硕士的潜在恶意使用以及错误信息和宣传的传播表示担忧。

L'avenir de l'IA reste incertain

人工智能的未来仍然不确定

Alors que les modèles de langage continuent de gagner en sophistication, la R&D se poursuit à un rythme effréné. Les LLM ont encore beaucoup à offrir, mais des questions éthiques et sociétales complexes restent à résoudre. Les débats sur les risques et les avantages de l'IA open source vont probablement se poursuivre, influençant l'avenir du développement et du déploiement de l'IA.

随着语言模型的不断复杂化，研发继续以惊人的速度进行。法学硕士仍然可以提供很多东西，但复杂的道德和社会问题仍有待解决。关于开源人工智能的风险和收益的争论可能会继续下去，影响人工智能开发和部署的未来。

免责声明:info@kdj.com

所提供的信息并非交易建议。根据本文提供的信息进行的任何投资，kdj.com不承担任何责任。加密货币具有高波动性，强烈建议您深入研究后，谨慎投资！

如您认为本网站上使用的内容侵犯了您的版权，请立即联系我们（info@kdj.com），我们将及时删除。

2025年02月23日发表的其他文章