bitcoin
bitcoin

$107266.451484 USD

-0.26%

ethereum
ethereum

$3954.795207 USD

-3.18%

xrp
xrp

$2.630716 USD

7.32%

tether
tether

$1.000162 USD

0.01%

solana
solana

$228.335148 USD

4.14%

bnb
bnb

$727.094505 USD

0.16%

dogecoin
dogecoin

$0.400960 USD

-2.21%

usd-coin
usd-coin

$1.000060 USD

0.01%

cardano
cardano

$1.085510 USD

-1.66%

tron
tron

$0.286178 USD

-3.02%

avalanche
avalanche

$49.343468 USD

-1.72%

chainlink
chainlink

$27.857511 USD

-7.16%

shiba-inu
shiba-inu

$0.000027 USD

-1.99%

toncoin
toncoin

$5.926408 USD

-3.58%

sui
sui

$4.653021 USD

-2.85%

暗号通貨のニュース記事

Sora Turbo と Gemini 2.0 はクリエイティブ業界と AI エージェントの時代にとって極めて重要な瞬間を迎えます

2024/12/17 23:00

OpenAIは先週、テキストからビデオへの生成型人工知能(AI)ツール「Sora」を発表した。同社はこのツールを2024年2月に初めてプレビューしたが、それ以来Soraの機能は進化しているため、最新バージョンを「Sora Turbo」と名付けていると述べた。

Sora Turbo と Gemini 2.0 はクリエイティブ業界と AI エージェントの時代にとって極めて重要な瞬間を迎えます

AI, Artificial Intelligence, ChatGPT, generative AI, Gemini 2.0, Google, Grok, OpenAI, Sora, text-to-video, X.

AI、人工知能、ChatGPT、生成 AI、Gemini 2.0、Google、Grok、OpenAI、Sora、テキストからビデオへの変換、X。

Hot Topics in AI: OpenAI’s Sora text-to-video generative AI tool now available to some users

AI のホットトピック: OpenAI の Sora テキストからビデオへの生成 AI ツールが一部のユーザーに利用可能に

OpenAI recently launched its text-to-video generative artificial intelligence (AI) tool, codenamed “Sora.” While the company first previewed this tool in February 2024, they claim that Sora’s capabilities have evolved significantly since then, prompting them to dub the latest version “Sora Turbo.” Notably, OpenAI is currently making this tool available to ChatGPT Plus and Pro users.

OpenAI は最近、コード名「Sora」というテキストからビデオへの生成型人工知能 (AI) ツールを発表しました。同社はこのツールを 2024 年 2 月に初めてプレビューしましたが、Sora の機能はそれ以来大幅に進化しており、最新バージョンを「Sora Turbo」と呼ぶようになったと主張しています。特に、OpenAI は現在、ChatGPT Plus および Pro ユーザーがこのツールを利用できるようにしています。

However, the company is heavily restricting access, leaving many people—including me—unable to try the tool immediately after its launch.

しかし、同社はアクセスを厳しく制限しているため、私を含む多くの人がツールの発売直後にこのツールを試すことができません。

For those with access, Sora Turbo allows users to create up to 50 videos per month at 480p resolution for GPT Plus subscribers, while GPT Pro subscribers can create up to 10x more videos at higher resolutions, including 1080p. Currently, videos max out at 20 seconds, and users can blend their assets with AI-generated elements or create entirely new content from text prompts.

アクセスできるユーザーは、Sora Turbo を使用して、GPT Plus 加入者は 480p の解像度で毎月最大 50 本のビデオを作成できます。一方、GPT Pro 加入者は、1080p を含む高解像度で最大 10 倍のビデオを作成できます。現在、ビデオの長さは最大 20 秒で、ユーザーは自分のアセットと AI が生成した要素をブレンドしたり、テキスト プロンプトからまったく新しいコンテンツを作成したりできます。

The release of text-to-video tools like Sora marks a pivotal moment for the creative industry. On the one hand, businesses will likely leverage these tools to produce high-quality marketing materials quickly and at a fraction of the cost of traditional production methods. Similarly, independent creators can craft videos for personal projects or even indie films that rival professional studio output. These tools have the potential to level the field in video production and allow anyone with a creative vision to bring their ideas to life.

Sora のようなテキストをビデオに変換するツールのリリースは、クリエイティブ業界にとって極めて重要な瞬間を迎えています。一方で、企業はこれらのツールを活用して、高品質のマーケティング資料を従来の制作方法の数分の一のコストで迅速に作成する可能性があります。同様に、独立系クリエイターは、個人プロジェクト用のビデオや、プロのスタジオ出力に匹敵するインディーズ映画さえも作成できます。これらのツールは、ビデオ制作の分野を平準化する可能性を秘めており、創造的なビジョンを持つ誰もが自分のアイデアを実現できるようになります。

However, text-to-video AI also introduces new risks, including potential misuse in creating deepfakes. As these tools become more accessible, bad actors and trolls will try to exploit this technology to deceive others. We’ve already seen similar issues arise with text-to-image and text-to-audio AI, and text-to-video is poised to become the next attack vector.

ただし、テキストからビデオへの AI は、ディープフェイクの作成における悪用の可能性など、新たなリスクももたらします。これらのツールがよりアクセスしやすくなると、悪意のある行為者や荒らしがこのテクノロジーを悪用して他の人を欺こうとします。同様の問題がテキストから画像への変換やテキストから音声への AI で発生するのをすでに確認しており、テキストからビデオへの変換が次の攻撃ベクトルになる準備ができています。

Google launches Gemini 2.0 and enters the era of AI Agents

Google が Gemini 2.0 を発表し、AI エージェントの時代に突入

Last week, Google (NASDAQ: GOOGL) announced its latest AI innovation: Gemini 2.0, which the company describes as its most advanced multimodal model yet. In their official announcement, they even go as far as to say that Gemini 2.0 will usher in a new era of “agentic” AI, enabling the creation of autonomous agents designed to simplify everyday tasks.

先週、Google (NASDAQ: GOOGL) は、最新の AI イノベーションである Gemini 2.0 を発表しました。同社はこれを、これまでで最も先進的なマルチモーダル モデルだと説明しています。公式発表では、Gemini 2.0 が「エージェント」AI の新時代を到来させ、日常業務を簡素化するように設計された自律エージェントの作成を可能にする、とまで述べています。

One of the first applications of Google’s AI agent powered by Gemini is Project Mariner, a Google Chrome extension currently in beta testing. Mariner acts as an AI-powered virtual assistant, capable of autonomously executing tasks like adding items to shopping carts, gathering information from multiple websites, and advising users on optimal strategies in games. However, to ensure safety and responsible use, Google says that Mariner will require a human somewhere in the operating loop at the moment, requiring user confirmation before the AI agent takes final action on things like making purchases.

Gemini を利用した Google の AI エージェントの最初のアプリケーションの 1 つは、現在ベータ テスト中の Google Chrome 拡張機能である Project Mariner です。 Mariner は AI を活用した仮想アシスタントとして機能し、ショッピング カートへの商品の追加、複数の Web サイトからの情報収集、ゲームでの最適な戦略についてのユーザーへのアドバイスなどのタスクを自律的に実行できます。ただし、安全性と責任ある使用を確保するために、現時点ではマリナーの運用ループのどこかに人間が必要であり、AIエージェントが購入などの最終的なアクションを起こす前にユーザーの確認が必要になるとGoogleは述べている。

Google’s announcement signals that AI agents are becoming a significant focus for the industry. Unlike chatbots, which serve as enhanced search engines, AI agents introduce an entirely new use case. These tools can perform complex tasks autonomously, but their adoption may require re-education for users unfamiliar with this type of technology. While chatbots like ChatGPT have become second nature for many and were rather intuitive for most, AI agents are something entirely different. There is no direct digital substitute for their functionality, and that gap may make adoption slower than expected.

Googleの発表は、AIエージェントが業界にとって重要な焦点になりつつあることを示唆している。強化された検索エンジンとして機能するチャットボットとは異なり、AI エージェントはまったく新しいユースケースを導入します。これらのツールは複雑なタスクを自律的に実行できますが、この種のテクノロジーに慣れていないユーザーは、その導入に再教育が必要になる場合があります。 ChatGPT のようなチャットボットは多くの人にとって自然なものとなっており、直感的に使用できるものですが、AI エージェントはまったく異なります。これらの機能をデジタルで直接代替するものはなく、そのギャップにより導入が予想より遅れる可能性があります。

I see accessibility and ease of use as one of the biggest challenges for the average AI user. I feel that AI agent workflows will be so unfamiliar to this group that they will need some sort of training or education before they can dive into these systems.

アクセシビリティと使いやすさは、平均的な AI ユーザーにとって最大の課題の 1 つであると私は考えています。 AI エージェントのワークフローはこのグループにとって非常に馴染みのないものになるため、これらのシステムに飛び込む前に、何らかのトレーニングや教育が必要になると思います。

X makes Grok free and adds Tweet analysis features

X は Grok を無料にし、ツイート分析機能を追加します

Meanwhile, X (formerly Twitter) expanded access to its internal AI chatbot, Grok, by making it free for all users. Previously available only to X Premium subscribers, Grok has also received two more notable upgrades, including enhanced text-to-image generation and a new feature for analyzing tweets.

一方、X (旧 Twitter) は、社内 AI チャットボットである Grok をすべてのユーザーに無料にすることで、そのアクセスを拡大しました。以前は X Premium 加入者のみが利用できましたが、Grok には、テキストから画像への生成の強化とツイート分析の新機能を含む、さらに 2 つの注目すべきアップグレードも施されています。

While its image generation capabilities are impressive, its text-to-text outputs fall short of industry standard. That being said, the Grok Analysis tool is the standout feature. It allows users to break down tweets into digestible summaries with context and links to related news or background information.

画像生成機能は優れていますが、テキストからテキストへの出力は業界標準には達していません。そうは言っても、Grok 分析ツールは傑出した機能です。これにより、ユーザーはツイートを、コンテキストや関連ニュースや背景情報へのリンクを含むわかりやすい要約に分割することができます。

While I find this tool useful, I still find it flawed. For instance, when I asked a follow-up question about an analyzed tweet, Grok seemed to “forget” the initial context, leading to fragmented conversations rather than a continuous dialogue from the first message sent.

このツールは便利だと思いますが、それでも欠陥があると感じています。たとえば、分析されたツイートについて私がフォローアップの質問をすると、Grok は最初の文脈を「忘れて」しまったようで、最初に送信されたメッセージからの連続した対話ではなく、断片的な会話になってしまいました。

Despite integrating into X’s ecosystem, Grok still lags behind leading AI chatbots like GPT-4, Claude 3.5, and Google’s Gemini 2.0.

X のエコシステムに統合されているにもかかわらず、Grok は依然として、GPT-4、Claude 3.5、Google の Gemini 2.0 などの主要な AI チャットボットに遅れをとっています。

ニュースソース:coingeek.com

免責事項:info@kdj.com

The information provided is not trading advice. kdj.com does not assume any responsibility for any investments made based on the information provided in this article. Cryptocurrencies are highly volatile and it is highly recommended that you invest with caution after thorough research!

If you believe that the content used on this website infringes your copyright, please contact us immediately (info@kdj.com) and we will delete it promptly.

2024年12月18日 に掲載されたその他の記事