連載
サイバーエージェントが公開した大規模言語モデルの実力を試す:清水亮の「世界を変えるAI」(2/4 ページ)
5月16日、サイバーエージェントが商用利用可能な7B(68億パラメータ)の大規模言語モデルOpenCalm7Bを公開した。早速その実力を試してみた。
AIによって私達の暮らしは、より便利に、そしてより良いモノ、そしてコトへと進化していきます。しかし、それは同時に、今まで以上にコンピュータとの「共生」を意識せざるを得ない時代でもあります。コンピュータと人との距離が近づく中で、コンピュータは、私たちに、そして、コンピュータを通じて、私たちに何をもたらすのでしょうか。コンピュータ技術が生む未来、そして、これからのコンピュータ
なかなか良さそうな結果が出てきた。もう少し試しやすくするために関数を定義する。
>>> def calm(s): ... inputs = tokenizer(s, return_tensors="pt").to(model.device) ... with torch.no_grad(): ... tokens = model.generate( ... **inputs, ... max_new_tokens=64, ... do_sample=True, ... temperature=0.7, ... pad_token_id=tokenizer.pad_token_id, ... ) ... output = tokenizer.decode(tokens[0], skip_special_tokens=True) ... print(output)
これで東京特許許可局と入力してみた。
>>> calm("東京特許許可局")
東京特許許可局局長。東京特許許可局長。東京特許許可局長官。東京発明特許許可局長。
>>> calm("東京特許許可局")
東京特許許可局局長・知財高裁所長・東京高等裁判所部総括判事を歴任し、昭和58年4月退官。昭和58年5月、昭和60年10月、昭和61年11月、昭和62年2月、昭和63年11月、平成2年4月、平成4年2月
なかなか凄い。結構感動した。5年くらい前に最初にRNN(リカレントニューラルネットワーク)に、日本語版Wikipedia全文を学習させた時の感覚に近い。
さらにインタラクティブに動作させるためのループを書く
>>> while True: ... calm(input())
いろいろ試してみた。
関連記事
- 百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
米OpenAIが独占的に提供する大規模言語モデル(LLM)に対し、さまざまなLLMが登場している。特に注目はオープンで自由な大規模言語モデル「Dolly-v2」だ。さながら現在は「不自由な大規模言語モデルと自由な大規模言語モデルの小競り合い」が起きている状態だ。 - 百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
米OpenAIが独占的に提供する大規模言語モデル(LLM)に対し、さまざまなLLMが登場している。特に注目はオープンで自由な大規模言語モデル「Dolly-v2」だ。さながら現在は「不自由な大規模言語モデルと自由な大規模言語モデルの小競り合い」が起きている状態だ。 - 仕事で使うGPT-4実践テクニック 実際に「AIアートグランプリ」の事務局で使ってみた
第一回AIアートグランプリの興奮もさめやらぬなか、GPT-4があっさりと公開。せっかくなので、まずは第一回AIアートグランプリの報告書をGPT4にまとめてもらってみる。さらにChain of Thoughtでキャッチフレーズを考えさせるなど、事務局の仕事に活用してみた。 - なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方
OpenAIが2022年に発表した対話型AI「ChatGPT」の衝撃は、米国ビッグテック最強の一角であるGoogleを動揺させた。Googleは急ぎ「Bard」と名付けたチャットボットを投入し、巻き返しを図る。 - まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?
2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どんな絵も描ける」AIである「Stable Diffusion」がついにオープンソースとして公開されたのだ。そこからの2カ月を振り返る。
Copyright © ITmedia, Inc. All Rights Reserved.