IBMが発表 メインフレームのモダナイゼーションを容易にする「あの方法」:CIO Dive
メインフレームのメンテナンスやモダナイゼーションに際して、レガシー言語を使いこなす人材の確保に悩む企業は多い。その解決のためにIBMが開発を進める「あの方法」とは。
クラウドの攻勢でレガシーシステムになりつつあるものの、メインフレームは依然として業務を支える重要な存在だ。しかし、メインフレーム全盛時代のコンピュータ言語を操る人材は年々減少している。
レガシー言語を扱える人材が減少 どう対応する?
メインフレームのメンテナンスやモダナイゼーションを実施する人材が減少している問題にわれわれはどう立ち向かうべきか。IBMが新たな解決法を提案した。
2023年8月22日のIBMの発表によると、同社は大規模言語モデル(LLM)の「watsonx.ai」を訓練してCOBOLコードを取り込み、Javaでビジネスアプリケーションを再構築できるようにした。IBMが提供するCOBOLとJavaの変換ツール「watsonx Code Assistant for Z」はレガシーアプリケーションの分析やリファクタリング、変換、検証に生成AIを使用することで、メインフレームのモダナイゼーションを容易にする。
IBMのソフトウェア部門であるIBM Z Softwareのスカイラ・ルーミス氏(バイスプレジデント)は、「このwatsonx Code Assistant for Zはメインフレームのモダナイゼーションを容易にするよう設計されており、レガシーコードの分析やリファクタリング、変換、結果の検証という困難なプロセスにおいて開発者を支援する」とデモの中で述べた。
IBMはwatsonx Code Assistant for Zの新機能を2023年内に展開する意向だという。
watsonx.aiの4つの機能
企業には技術的負債が付きまとい、重要なビジネス機能が難解なコードの上に危険な状態で放置されていることが多い。モダナイゼーションの努力にもかかわらず、企業はいまだに1950年代に構築されたプログラミング言語であるCOBOLで設計されたオンプレミスアプリケーションを実行している。
IBMは平均的な個々のクライアント企業が、数千万行のCOBOLを実稼働させていると推定している。2022年にソフトウェア会社のMicro Focusが調査会社のVanson Bourneに依頼して実施した調査の報告書によると、企業の生産システムは世界全体で毎日8000億行以上のCOBOLを実行している(注1)。
AI(人工知能)とLLMを開発しているAnthropicやOpenAIを含む幾つかの生成AI企業は、最近コーディングアシスタントとしての機能が向上したLLMを発表した(注2)。また2023年2月、Microsoftは企業向けのAI対応開発者ツール「GitHub Copilot for Business」をリリースし、上半期のユーザー数が倍増している(注3)。
われわれが利用している言語には、市販されている最高のLLMでも及ばないほどのニュアンスや音調のバリエーションがあるが、コンピュータコードは意味論が明確に表現された単純な機械命令で構成されている。
IBMのフェローでIBM Z SoftwareのCTO(最高技術責任者)を務めるカイル・シャレット氏は、「コーディングの翻訳ではエラーやAIが事実に基づかない情報を生成するハルシネーションが発生することがあるが、それらを特定して解決するのは比較的簡単だ。コードは嘘をつかないので、コードに入り込んだハルシネーションを即座に特定し修正できる」と述べる。
IBMはCOBOLデータでLLMを訓練してC++やJava、Python、FORTRAN、COBOLを含む55以上の一般的なプログラミング言語の1400万コードサンプルのデータベースである同社の「CodeNet」でデータセットをテストした(注4)。IBMが提供しているAI学習用の教師用データセット「Project CodeNet」を使用して、COBOLからJavaへの翻訳の精度を試したのだ。
watsonx.aiはその後、RedHatのAnsible自動化ツールキットのコーディングアシスタントと、新しいCOBOLソリューションという2つの特定のユースケース用に調整され、現在では80以上の言語と1兆5000億トークンのデータを用いて学習しているという(注5)。
「リスクを軽減するため、watsonx.aiの学習データは全てライセンスが供与されたオープンソースソフトウェアから作成されている」とシャレット氏は述べた。同ソリューションには4つの機能がある。
- 自動検出:ツールが元のスクリプトを分析し、データの依存関係を特定することでアプリケーションのメタデータの概要を提供する
- リファクタリング:アプリケーションのビジネス機能を特定し、モダナイゼーションの更新を提案する
- 変換:ユーザーが生成AIのCOBOLからJavaへの変換機能を呼び出す
- 検証:新しいサービスが元のスクリプトと意味的にも論理的にも同等であることを確認するために、結果を検証する
「われわれがやっているのは、COBOL構文を1行ずつJavaに変換することではない。そんなことをすれば、COBOLの構文がほとんど読めず、保守が困難なJavaで表現されることになる」とルーミス氏は指摘する。
watsonxツールキットの拡張は、ハイブリッドクラウドやメインフレームのモダナイゼーション、新たなAI機能、ITコンサルティングサービスを中心に構築された、より広範なビジネス統合戦略の一環だ(注6)。
IBMはMicrosoftと提携してメインフレームのモダナイゼーションを容易にし、エンタープライズグレードの生成AIソリューションを展開している(注7)。両社は2023年6月に「Microsoft Azure Marketplace」で「IBM Z and Cloud Modernization Stack」を発表し、2023年8月15日にはジェネレーティブAIのマネージドサービスを開始した(注8)。
(注1)COBOL Market Shown to be Three Times Larger than Previously Estimated in New Independent Survey(CISION)
(注2)Anthropic, OpenAI beef up coding capabilities for their LLMs(CIO Dive)
(注3)Microsoft pushes AI as GitHub Copilot for Business hits 27K customers(CIO Dive)
(注4)Kickstarting AI for Code: Introducing IBM’s Project CodeNet(IBM)
(注5)Red Hat Introduces Ansible Lightspeed for AI-Driven IT Automation(Red Hat)
(注6)IBM sees Red Hat growth as model for its AI business(CIO Dive)
(注7)IBM, Microsoft launch generative AI managed service(CIO Dive)
(注8)IBM, Microsoft launch generative AI managed service(CIO Dive)
関連記事
- 動き出した「日の丸LLM」プロジェクトの"中身"――日本学術会議の講演から探る
生成AIの基盤技術であるLLMの開発競争が注目される中で、「日本語力」を前面に押し出す「日の丸LLM研究開発プロジェクト」が本格的に始動した。その中身と可能性は――。 - 松尾 豊氏率いる松尾研、100億パラメータのLLM「Weblab-10B」を開発 日本語と英語に対応
東京大学松尾研究室は100億パラメータサイズの大規模言語モデル「Weblab-10B」を開発した。日本語と英語の2カ国語に対応する。 - 商用利用可能な70億パラメーターの日本語LLMをELYZAが公開 性能はGPT-3.5に匹敵
ELYZAはMetaのLlama 2をベースにした新しい日本語の大規模言語モデルを開発した。性能はGPT-3.5に匹敵するとされており、研究および商用利用が可能となっている。 - LINEが日本語LLMをオープンソースで提供 36億パラメータを保有
LINEは日本語による大規模言語モデル「japanese-large-lm」をオープンソースで公開した。36億パラメータモデルと17億パラメータモデルの2つが公開されている。
© Industry Dive. All rights reserved.