生成AIでメモアプリが進化? 自分だけのチャットAIが作れる、Google「NotebookLM」を試してみた:小寺信良のIT大作戦(3/3 ページ)
Gemini 1.5 Pro搭載、GoogleのAIノート「NotebookLM」が日本語を含む200以上の国や地域への提供を開始した。今回は実際に参照文献(ソース)を登録してNotebookLMの動作や活用方法などを検証しつつ、利用の際も注意点なども紹介する。
「NotebookLM」をどう使っていくか
1つのソースには、50万語を含めることができるという。これが文字数のことなのか、あるいは単語のことなのかはよく分からないが、文字数だとしてもかなりの長文が読み込める。
ただし、ノートブック内に読み込めるソースの数は、どこかに限界があるようだ。どれくらい読み込めるかテストしているうちに、1つのノートブックに56個、54個、40個、34個とどんどん減っていった。翌日にはまた54個までソースが追加できるようになっていた。今のところどういうルールになっているのかは、判然としない。
今回作成したノートブックは、ソース数で29個、1ソースあたり大体4000字ぐらいなので、12万字ぐらいのデータである。内容も放送とIPというテーマ縛りなので、回答の内容にもブレが少ない。ノートブックに登録するソースは、量的な限界から考えても、何らかのテーマに絞って使うことを想定しているのだろう。
このノートブックは、他の人を招待できる。メールアドレスで参加を要請することもできるし、リンクを送って参加を呼びかけることもできる。ただ、リンクで共有するなら、ノートブックを「リンクを知っている人は閲覧可」のようなパーミッション変更が必要になると思うのだが、今のところそうした設定機能がないので、リンクを送っただけでは共有できなかった。このあたりはおいおい実装されるのだろう。
複数人で共有できるようになれば、共通のデータを使ったグループワークも可能になる。例えば自社の社則を読み込ませて法務的な抜け穴がないか探す、社員からの申請は社則と照らし合わせて妥当かどうか検討するといった活用が考えられる。
ノートブックの共有で気を付けたいのが、ソースの権利関係だ。前段にも書いたが、ソースはクラウドにコピーされるので、複製権や公衆送信権の問題になりうる。
AIへの学習は、日本の著作権法では権利制限されているので自由に使えるのでは? と思われるかもしれないが、後付けで特徴を出すために追加学習させるLoRA(Low-Rank Adaptation)や、テキスト生成をプライベートデータソースまたは独自のデータソースからの情報で補完するRAG(Retrieval Augmented Generation)は、文化庁のガイドラインによれば、「権利制限の対象外」と考えるべきだ。ノートブックへのソース入力は、RAGそのものである。
よって、複数人がノートブックを利用するなら、利用者の1人が権利を持っていて、それを共有し生成物の利用を認める意思があることや、著作権が発生しないもの(法律・条例・社則など)である必要がある。
大学教員が、授業のテキストをベースに試験問題を作るといった作業にも使えるだろう。ただしソースとしては、自分で執筆したテキストを食わせる必要がある。テキスト内に引用があった場合でも、一応引用という形がクリアされていれば問題ないとは思うが、出力結果に引用が区別されているかは、今のところよく分からない。もし区別なく使われていた場合は、剽窃となる可能性があるので、出力結果は入念にチェックすべきだろう。
AIから人間が求める結果を引き出すには、AIをコントロールする必要がある。それには大きく分けて3つの方法がある。これまではAIに投げかけるプロンプトを工夫して調整する、「プロンプトエンジニアリング」がメインの方法だった。2つめが「NotebookLM」で採用した、「RAG」だ。基盤モデルの学習結果を利用しつつも、回答の範囲を追加学習の範囲で限定するので、ハルシネーションや誤情報の出力が少ないところがメリットである。3つめの「Fine-Tuning」は基盤モデルそのものをカスタマイズする方法なので、かなり大がかりとなる。
すなわちRAGは、オールマイティな回答が得られるわけではないが、少ない労力でAIを専門分野に絞り込む方法として、利用価値がある。実際に使ってみた感触としては、ソースが限定できるのでノイズが入りにくく、エンタープライズでは使いやすいだろうと思う。一方個人で利用する場合には、AIに求めるのは自分の知識や能力を超えることなので、汎用的なAIのほうが使うメリットが大きいだろう。そもそも個人では、自分が権利を持つ膨大なソースを持つ人はそれほど多くないということもある。
AIに対するアプローチの違いを正しく理解し、「今やってることは何なのか」に意識的になることが、人間側に求められることだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Googleの「Gemini 1.5 Pro」採用メモアプリ「NotebookLM」、日本でも利用可能に
Googleは、昨年7月に米国でリリースしたAI活用メモアプリ「NotebookLM」を日本を含む200カ国で公開した。ユーザーが指定したソースのみをグラウンディングに使うので、「ピザに接着剤」のような問題は発生しなそうだ。
Appleが「マルチカメラ編集」へ向かう理由 「Final Cut Pro 2」新機能から読み解く、その“本気度合い”
日本時間の5月8日に開催されたAppleの新製品発表会は。今回は新iPadがメインで、多くの人がそこに言及しているが、動画制作のプロならiPadを使った新しい「Finalcut Pro 2」のアプローチに注目したことだろう。
「5Gでライブ中継」が現実に? スマホみたいな5Gトランスミッターで実現する映像の未来
2024年3月に発売された5Gトランスミッタ、ソニー「PDT-FP1」をご存じだろうか。デジタル一眼「α」のアクセサリーとして販売をスタートし、カメラ量販店でも購入できることから、コンシューマー機のような扱いになっているが、実際にはプロ用機である。
テレビ業界のハードワークは、なぜ無くならないのか
この連載ではこれまで、主に映像・放送技術のDX化についてフォーカスしてきたが、そもそもDXとは、人の働き方改革とセットの話である。今回はテレビ業界の働き方について、DXによる働き方改革は起こりうるのかを考えてみたい。
カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた
日本語で話す動画を、英語に自動翻訳+アフレコしてくれるツール「Captions」。もともとはiOS版として提供されていたサービスだが、PC版(β版)が登場。AIを使った新機能も含め実際にテストしてみた。