最新記事一覧
連載「シミュレーションを制する極意 〜Simulation Governanceの集大成〜」では、この10年本来の効果を発揮できないまま停滞し続けるCAE活用現場の本質的な改革を目指し、「Simulation Governance」のコンセプトや重要性について説く。引き続き、各サブカテゴリーの項目のポイントやレベルの意味を解説しながら、詳細な診断データを眺めていく。連載第10回では、文化カテゴリーの「経営層」と「組織文化」にフォーカスする。
()
データ分析の初歩から学んでいく連載の第16回(最終回)。分析に適した形にデータを入力/変換する方法を、Excelを使って手を動かしながら学んでいきましょう。スタック形式のレコードをアンスタック形式に変換する方法、CVSファイルやWebページからデータを読み込む方法などについて解説します。
()
データ駆動型の意思決定がビジネスに欠かせなくなった。企業は予測モデルを構築してシミュレーションを重ねることで、深い洞察を得ることができる。代表的な4つのモデルについて、その起源や特徴を解説する。
()
ChatGPTを対話システムと見なし、これまでの対話システムで用いられてきた技術との違いを整理しながら、どのようにして人間のような自然で流ちょうな対話が実現できているのかを解説する本連載。第2回では、対話システムへの入力を処理する言語理解について解説した。今回は、第1回で取り上げた対話システムを中心に、対話管理と応答文生成において用いられている技術について解説する。
()
2023年にMONOistで最も読まれた記事は何だったのでしょうか。今回はMONOistの全記事の中で2023年に読まれた記事のトップ10を紹介します。
()
NumPyとMatplotlibを組み合わせ、データセットに含まれているデータがどのような分布になっているかを可視化してみましょう。新たな知見が得られるかもしれません。
()
Samsungは、来年初頭に独自のモバイル生成AI「Galaxy AI」をスマートフォンに搭載すると発表した。通話のリアルタイム翻訳機能などを利用できるとしている。
()
これまで製造現場のコンプライアンス違反といえば、品質にかかわる不正や不祥事がメインでした。しかし近年、ESG経営やSDGsの広まりから、品質以外の分野でも高度なコンプライアンス要求が生じています。本連載ではコンプライアンスの高度化/複雑化を踏まえ、製造現場が順守すべきコンプライアンスの外延を展望します。
()
NumPyが提供する基本統計量を調べるさまざまな関数を使って、サンプルデータにはどんな特徴があるかを調べてみましょう。
()
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第6回。集団の中での位置をパーセント単位で求めたり、偏差値を求めたりする方法と、その考え方を説明します。偏差値は大学や高校のランク付けによく使われていますが、序列を付けるためのものではなく、異なる分布の集団の間でも位置が比較できるとても便利な値です。
()
6月28日に開催されたクリエイターエコノミー協議会の発表会で、経済学者の山口真一博士が、「炎上事件にネガティブな投稿をしている人は約40万人に1人」など、誹謗中傷の実態について説明した。
()
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第5回。分布のばらつきの度合いを表す値として散布度を取り上げ、尺度や分布によって適切な散布度を利用する必要があることを説明します。順序尺度の散布度として使われる四分位範囲と、名義尺度の散布度として使われる平均情報量のお話です。
()
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第3回。分布の中心的な位置を表す値として代表値を取り上げ、尺度や分布によって適切な代表値を利用する必要があることを説明します。
()
大人になって解いてみると、意外と難しい。
()
本連載は、品質管理の枠組みであるトヨタ式TQMと、製造現場での活用が期待されるIoT技術を組み合わせた、DX時代の品質保証強化を狙いとしている。第7回は、品質管理のための解析手法をどうすればデジタル化できるかについて紹介する。
()
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載のスタート。今回は、なぜデータ分析の重要性が高まっているか、ビジネスに生かすために何を学ぶべきかを概観した後、連載の全体像を紹介します。
()
NTTとJAXAが「衛星MIMO技術を活用した920MHz帯衛星IoTプラットフォームの軌道上実証」を実施。地上通信網が整備されていない海洋や山間部などでのIoTデバイス活用や、センシングサービス提供を目指す。
()
データ分析において最もよく使われる表形式のデータを取り扱う方法を見ていく。まず、pandasデータフレームの基本的な取り扱い方法を確認し、次に、各種の基本統計量を求める。また、基本統計量の可視化を行い、データの「見方」についても触れる。最後に、scikit-learnを使った回帰と分類の簡単な例を紹介する。
()
皆さんの考える「優秀な人材」についてご意見や採用基準がありましたら、コメントやSNSで共有していただければと存じます。
()
九州大学らは、直近1カ月間のひきこもり傾向を簡便に把握できる自記式質問票「HQ-25M」を開発した。オンライン調査の結果、ひきこもり傾向が高いほどHQ-25Mスコアが高いことが示され、同質問票の予備的妥当性が確認された。
()
利用者の1日のトラフィック量やポート別使用量などを基に、この1年間のトラフィック傾向の変化を報告します。コロナ禍も3年目に入り、2021年に報告した堅調なトラフィック増加が、2022年に入り、どのように推移しているのか気になるところです。ここ1年のインターネットトラフィックの動向を解析してみました。
()
AI/機械学習で使われるデータを表現するためにはベクトルや行列などの線形代数を理解することが必要不可欠。今回は行列式と固有値/固有ベクトルの求め方、さらに、それらの応用について、プログラミングの方法を初歩から見ていく。
()
精度向上により、近年利用が広まっている「ニューラル機械翻訳」。その仕組みを、自分で動かしながら学んでみましょう。第2回はユースケースごとに「JoeyNMT」をカスタマイズする方法や、Discordのチャットbotに組み込む方法を解説します。
()
今回は、株価情報のデータベースを「Docker」で作ってみます。長いエンジニア生活で私が学んだこと――。それは、「自力で作らなかったものは、結局、自分の”モノ”にはならない」ということです。だからこそ、やってみるのです。
()
Kubernetesやクラウドネイティブをより便利に利用する技術やツールの概要、使い方を凝縮して紹介する連載。今回は、Observabilityのシグナル「メトリクス」について紹介し、「Prometheus」「Grafana」を使う上でのポイントを解説します。
()
花王とPreferred Networks(PFN)は「仮想人体生成モデル」を開発した。健康診断などで得られる身体データから、ライフスタイルや性格傾向、嗜好性、ストレス状態など1600以上の項目を網羅し、ある項目のデータを入力すると別の項目の推定データを出力できる。花王は同モデルをAPI経由で提供する新規デジタル基盤事業の準備を進める方針だ。
()
積分法に関する数値計算のプログラミングの方法を見ていく。最初に台形公式やシンプソンの公式を使った方法を紹介し、次に乱数を使ったモンテカルロ法による近似方法を見る。
()
情報通信研究機構は、携帯電話基地局などからの電波ばく露レベルの大規模かつ長期測定を実施した。同一地域の10年前との比較では、電波ばく露レベルは上昇傾向にあったものの、電波防護指針値よりも十分に低いレベルにあった。
()
今回はseabornライブラリを使用して、Titanicデータセットの各列が生死とどのような関係にあるかを(少しだけ)確認してみました。それだけで、スコアはアップ!
()
Kaggle公式「機械学習」入門/中級講座の次は、本稿で紹介する動画シリーズで学ぶのがオススメ。記事を前中後編に分け、後編では交差検証を用いたモデルのスタッキングやブレンディングを試した体験を共有します。
()
新型コロナウイルス感染症(COVID-19)のワクチンについて、必要回数のワクチン接種が完了した割合が70%を超えた日本。今回は、テーマをこれまでとは180度転換し、「コロナのワクチン接種を拒否することが、理論的か否か」について語ってみたいと思います。ワクチン接種を拒否する人も、肯定する人も、お互いの立場に立って、ワクチン接種について考えてみたいのです。今回もおなじみ、“轢断のシバタ先生”が、超大作の「シバタレポート」を執筆してくださいました。
()
用語「相関係数(ピアソンの積率相関係数)」について説明。相関係数とは2つの変数間の関係の強さと方向性を表す、1〜0〜-1の範囲の数値。1(強い正の相関)では、2つの変数が強く同方向に連動する。-1(強い負の相関)では強く逆方向に連動する。相関なしでは、連動しない。
()
「モデルとデータの可視化」というテーマで各種グラフの描画方法を前後編で解説。後編である今回は、棒グラフ/ヒストグラム/箱ひげ図/散布図/ヒートマップを作成し、複数のグラフを並べて表示する方法を説明する。
()
正規化とは、比較や分析を容易にするために、データの単位やスケールを共通の基準に整えること。単に「正規化」(Min-Max法)と言った場合は、データを最小値「0」〜最大値「1」にスケーリングすることを意味する。また、正規化の一種である標準化は、データを平均「0」、標準偏差「1」にスケーリングすることを意味する。
()
「モデルとデータの可視化」というテーマで関数グラフの描画やヒストグラムや散布図などの各種グラフの取り扱い方を前後編で解説。前編である今回はシグモイド関数のグラフを描く問題を手始めに、さまざまなグラフの描画方法を見ていく。
()
用語「平均絶対偏差」「中央絶対偏差」について説明。いずれもデータの広がり具合を表す統計量。平均絶対偏差は、各データに対して「平均値との差」(=偏差)の絶対値を計算し、その総和をデータ数で割った値(=平均値)を表す。中央絶対偏差は、各データに対して「中央値との差」(=偏差)の絶対値を計算し、その全ての絶対値から求めた中央値を表す。
()
用語「平均値」「中央値」「最頻値」について説明。平均値はデータの合計値をデータ数で割った値、中央値はデータを順番に並べた際に中央に位置する値、最頻値は最も頻繁に出現する値を表す。
()
全労連が「全国一律で時給1500円が必要」と訴えたところ、労働者からは「それでも足りない」といった意見があった一方で、「反対」の声も多い。自分の生活が楽になるのに、なぜ反対するのか。その背景には……。
()
連載の通常の流れとは別の番外編。AIや機械学習でよく使う「指数」を解説。指数関数の性質や指数関数の微分法についても簡単に紹介する。
()
機械学習をビジネスで活用したい人に向け、最新技術情報に基づき、機械学習の概要、統計学との違い、機械学習の作業フローと学習方法、回帰/分類/クラスタリング/次元削減に使える手法、次の一歩を踏み出すための参考情報を、5分で読めるコンパクトな内容で紹介する。
()
Study-AIは「中学生から分かるAI数学講座」の無料配信を開始した。本講座を受講することで、AIの資格試験「E資格」に出てくる数式を読めるようになるという。活性化関数や確率分布などについても学べる。
()
機械学習やディープラーニングに必要な数学項目をピックアップし、そういった項目を教科書的〜実践的にカバーしているオススメの「数学」本を紹介する。また中学〜大学までの数学全体を学び直したい人向けの本も紹介。
()
今回は低周波のインピーダンス測定を行う事例について、LCRメーターを使う場合とロックインアンプや周波数特性分析器などを使う場合に分けて解説する。
()
統計学や機械学習で使われるさまざまな確率分布のうち、連続分布の例として正規分布とベータ分布について見ていく。また、最近主流になりつつあるベイズ統計の関係についても簡単に紹介する。
()
分類や推定・予測など、機械学習のさまざまな手法の基礎をなす「確率と統計」における「確率分布」とはどのようなものか。離散分布や連続分布といった種類に分けられるが、その一つである離散分布の例としてベルヌーイ分布と二項分布について見ていく。
()
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回は「ベイズの定理」について分かりやすい図を交えて解説します。
()
理化学研究所のスパコン「富岳」を用い、コロナウイルス感染症(COVID-19)に関する飛沫の飛散シミュレーションが実施されている。理化学研究所が独自開発する流体シミュレーションソフトウェア「CUBE」による飛散シミュレーションの概要、注目すべき結果などについて、理化学研究所 計算科学研究センター チームリーダー/神戸大学大学院システム情報学研究科 教授の坪倉誠氏に話を聞いた。
()
中国科技大の研究チームが、従来のスパコンより量子コンピュータの計算能力の方が上回ることを示す「量子超越性」を光量子コンピュータで実証した。
()
おそらく2020年は日本の自動車のビンテージイヤーになると思う。20年のクルマたちは、もっと総合的な能力で世界トップといえる実力を持っている。その総合力とは何かといわれると、それはおそらくリニアリティの圧倒的な向上だ。
()
PyTorchが提供するConv2dクラスとConvTranspose2dクラスを使ってDCGANを実装しながら、その特徴を見ていきましょう。
()