2台のMac StudioをThunderbolt 5で連結! 計128GBメモリ環境と分散推論「exo」でLLMを爆速化してみた(2/4 ページ)
複数デバイスを束ねてLLMを動かす「exo」を用い、Mac Studio 2台によるクラスタを構築。macOS Tahoeで解禁されたRDMAとTensor並列を組み合わせ、120B級モデルの生成速度を1.36倍に向上させた検証結果と導入手順を紹介する。
exoの導入手順
さて、前置きはこれくらいにして、実際にMac Studioを2台を使ってexoクラスタを構成してみよう。macOS環境でのexoの導入手順は非常に簡単だ。
まず、GitHubの公式リリースページにアクセスし、.dmgファイルをダウンロードしてインストールする(執筆段階のバージョンはEXO-1.0.69.dmg)。
インストール後、アプリケーションフォルダーからexoを起動すると、「EXO Network Configuration」画面が表示されるので、「Install」をクリックして進める。
続いて「Add devices to run larger models」という画面が表示される。既にThunderbolt 5ケーブルでMac Studio同士を接続し、片方のセットアップが完了していれば、「Your EXO network」にクラスタ構成が表示されるので、「Continue」をクリックしよう。
なお、Thunderbolt 5ケーブルでノード間を接続し、かつRDMAを利用する場合はRJ-45ポートの左隣のThunderbolt 5ポートはexoでRDMAを利用できないため、それ以外のポートに接続するようにしてほしい。
モデルのダウンロードが終わると、exoのメイン画面が表示される。今回のテスト環境では、最初にセットアップしたMac Studioで事前に「gpt-oss-20b」インスタンスを作成していたため、「INSTANCES」の一覧にその状態が表示されている。
驚くことにexoのクラスタ構成は、それぞれのノードにexoをインストールして、Thunderbolt 5ケーブルを接続するだけ、と高度な処理を実現するにもかかわらず、その手順は非常に簡単だ。
新たにインスタンスを作成する場合は、「LOAD MODEL」から読み込みたいモデルを選択する。デフォルト設定では、モデルの読み込みに必要なメモリ数に応じて、インスタンスの構成案が自動的に表示されるため、あとは「LAUNCH」をクリックすればOKだ。
関連記事
自作PCを売却して「Mac Studio」へ ローカルLLMサーバ移行で得られた驚きの“ワッパ”と安心感
クラウドAIの制約を打破する「ローカルLLM」。自作PCからM4 Max搭載Mac Studioへ環境を刷新した筆者が、応答速度や驚異の低消費電力を徹底検証する。ついにOCuLink&USB4 Version 2.0(Thunderbolt 5)両対応のeGPUドック「Minisforum DEG2」を試す
MinisforumのeGPUドック「DEG2」は、Thunderbolt 5とOCuLinkに両対応。豊富なポートやM.2スロットを備え、RTX 5060 Ti接続で最新ゲームやAI性能が劇的に向上。ミニPCを最強環境へ変える万能ドックの実力を探る。フルスペックの新型「Mac Studio」に触れて考える、Appleが提案するM3 Ultraチップの真価
M3 Ultraチップを搭載した「Mac Studio」が登場したが、気になるのはM4 Maxチップを搭載した製品との用途の違いだ。新型「Mac Studio」発表 M3 Ultra/M4 Max搭載、Thunderbolt 5に対応
今回の新型で搭載された最新チップと、大容量化されたユニファイドメモリによって、クリエイター用途はもちろんのこと、オンデバイスでの大規模言語モデルが実用的に動作することが期待される。予想通りだが想像以上! M2 Ultraチップ搭載「Mac Studio」で動画編集が爆発する!
Appleが、クリエイター向けデスクトップMac「Mac Studio」を発売した。Mac Studioは、現時点におけるApple Siliconの最上位SoC「M2 Ultraチップ」を搭載する構成も選択できる。今回は、同チップを搭載する構成を実際に使ってみよう。
Copyright © ITmedia, Inc. All Rights Reserved.