まずはレシートの動画撮影から。「合計金額がブレずに写っていればいいかな」程度で、丁寧すぎずサクサクとレシートを写していきました。
実際にiPhoneの標準カメラアプリで撮影したところ、Geminiがなぜか動画ファイルを認識してくれなかったため、サードパーティー製のカメラアプリで撮影した動画ファイルを使用することで問題を回避できました。
Geminiの動画アップロード機能に対応するファイル形式は「MP4、MPEG、MOV、AVI、X-FLV、MPG、WEBM、WMV、3GPP」で、1度に最大10ファイルまでをアップロードできます。動画のファイルサイズは1つ最大2GB、長さは計5分までとなっており、有料のGoogle AI ProまたはGoogle AI Ultraを契約しているユーザーは計1時間までアップロードできます。
Geminiに動画をアップロードする方法は簡単です。スマートフォンでレシートの動画を撮影したら、Geminiアプリを開いて「+」ボタン→「ギャラリー」から動画ファイルを選択するだけ。プロンプトは「動画に写っているレシートの合計金額を出してください」と入れてみました。
しばらくすると、見事にレシートの内容を表示してくれました。動画の秒数ごとに写っていたレシートの合計金額を示してくれた上に、合計金額を出すことも可能です。
これなら複数のレシートを見て電卓をたたく必要はなく、テキトーにレシートをスマホカメラの前にかざして動画撮影するだけで集計できるようになりました。
さらに一歩進んで、レシートの品目から「食費」「外食」「日用品」「ペット」(筆者の場合)のカテゴリーを判断して分類するように指示すれば、事前にレシートを分ける必要すらなく、ただ何も考えずレシートを動画撮影するだけで済みます。プロンプト次第では、もっと高度な読み取りや、スプレッドシートに直接書き込むこともできそうです。
GeminiアプリのアイコンがMaterial 3対応デザインに
Google Geminiを「使いやすい環境」はPCかスマホのどっち? 3つの理由を実体験を例に紹介
Googleが「Geminiのキャラクター」をAIで生成 作り方も公開──「このプロンプトをコピペして」
スマホ/タブレットから「NotebookLM」で資料を指定して情報をまとめてもらう方法
「NotebookLM」アプリでアップロードしたソースの削除&名称変更をするには?Copyright © ITmedia, Inc. All Rights Reserved.