キーワードを探す
検索

「確率分布」関連の最新 ニュース・レビュー・解説 記事 まとめ

最新記事一覧

連載「シミュレーションを制する極意 〜Simulation Governanceの集大成〜」では、この10年本来の効果を発揮できないまま停滞し続けるCAE活用現場の本質的な改革を目指し、「Simulation Governance」のコンセプトや重要性について説く。引き続き、各サブカテゴリーの項目のポイントやレベルの意味を解説しながら、詳細な診断データを眺めていく。連載第10回では、文化カテゴリーの「経営層」と「組織文化」にフォーカスする。

()

データ分析の初歩から学んでいく連載の第16回(最終回)。分析に適した形にデータを入力/変換する方法を、Excelを使って手を動かしながら学んでいきましょう。スタック形式のレコードをアンスタック形式に変換する方法、CVSファイルやWebページからデータを読み込む方法などについて解説します。

()

ChatGPTを対話システムと見なし、これまでの対話システムで用いられてきた技術との違いを整理しながら、どのようにして人間のような自然で流ちょうな対話が実現できているのかを解説する本連載。第2回では、対話システムへの入力を処理する言語理解について解説した。今回は、第1回で取り上げた対話システムを中心に、対話管理と応答文生成において用いられている技術について解説する。

()

これまで製造現場のコンプライアンス違反といえば、品質にかかわる不正や不祥事がメインでした。しかし近年、ESG経営やSDGsの広まりから、品質以外の分野でも高度なコンプライアンス要求が生じています。本連載ではコンプライアンスの高度化/複雑化を踏まえ、製造現場が順守すべきコンプライアンスの外延を展望します。

()

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第6回。集団の中での位置をパーセント単位で求めたり、偏差値を求めたりする方法と、その考え方を説明します。偏差値は大学や高校のランク付けによく使われていますが、序列を付けるためのものではなく、異なる分布の集団の間でも位置が比較できるとても便利な値です。

()

データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第5回。分布のばらつきの度合いを表す値として散布度を取り上げ、尺度や分布によって適切な散布度を利用する必要があることを説明します。順序尺度の散布度として使われる四分位範囲と、名義尺度の散布度として使われる平均情報量のお話です。

()

データ分析において最もよく使われる表形式のデータを取り扱う方法を見ていく。まず、pandasデータフレームの基本的な取り扱い方法を確認し、次に、各種の基本統計量を求める。また、基本統計量の可視化を行い、データの「見方」についても触れる。最後に、scikit-learnを使った回帰と分類の簡単な例を紹介する。

()

利用者の1日のトラフィック量やポート別使用量などを基に、この1年間のトラフィック傾向の変化を報告します。コロナ禍も3年目に入り、2021年に報告した堅調なトラフィック増加が、2022年に入り、どのように推移しているのか気になるところです。ここ1年のインターネットトラフィックの動向を解析してみました。

()

精度向上により、近年利用が広まっている「ニューラル機械翻訳」。その仕組みを、自分で動かしながら学んでみましょう。第2回はユースケースごとに「JoeyNMT」をカスタマイズする方法や、Discordのチャットbotに組み込む方法を解説します。

()

Kubernetesやクラウドネイティブをより便利に利用する技術やツールの概要、使い方を凝縮して紹介する連載。今回は、Observabilityのシグナル「メトリクス」について紹介し、「Prometheus」「Grafana」を使う上でのポイントを解説します。

()

花王とPreferred Networks(PFN)は「仮想人体生成モデル」を開発した。健康診断などで得られる身体データから、ライフスタイルや性格傾向、嗜好性、ストレス状態など1600以上の項目を網羅し、ある項目のデータを入力すると別の項目の推定データを出力できる。花王は同モデルをAPI経由で提供する新規デジタル基盤事業の準備を進める方針だ。

()

新型コロナウイルス感染症(COVID-19)のワクチンについて、必要回数のワクチン接種が完了した割合が70%を超えた日本。今回は、テーマをこれまでとは180度転換し、「コロナのワクチン接種を拒否することが、理論的か否か」について語ってみたいと思います。ワクチン接種を拒否する人も、肯定する人も、お互いの立場に立って、ワクチン接種について考えてみたいのです。今回もおなじみ、“轢断のシバタ先生”が、超大作の「シバタレポート」を執筆してくださいました。

()

用語「相関係数(ピアソンの積率相関係数)」について説明。相関係数とは2つの変数間の関係の強さと方向性を表す、1〜0〜-1の範囲の数値。1(強い正の相関)では、2つの変数が強く同方向に連動する。-1(強い負の相関)では強く逆方向に連動する。相関なしでは、連動しない。

()

正規化とは、比較や分析を容易にするために、データの単位やスケールを共通の基準に整えること。単に「正規化」(Min-Max法)と言った場合は、データを最小値「0」〜最大値「1」にスケーリングすることを意味する。また、正規化の一種である標準化は、データを平均「0」、標準偏差「1」にスケーリングすることを意味する。

()

用語「平均絶対偏差」「中央絶対偏差」について説明。いずれもデータの広がり具合を表す統計量。平均絶対偏差は、各データに対して「平均値との差」(=偏差)の絶対値を計算し、その総和をデータ数で割った値(=平均値)を表す。中央絶対偏差は、各データに対して「中央値との差」(=偏差)の絶対値を計算し、その全ての絶対値から求めた中央値を表す。

()

機械学習をビジネスで活用したい人に向け、最新技術情報に基づき、機械学習の概要、統計学との違い、機械学習の作業フローと学習方法、回帰/分類/クラスタリング/次元削減に使える手法、次の一歩を踏み出すための参考情報を、5分で読めるコンパクトな内容で紹介する。

()

分類や推定・予測など、機械学習のさまざまな手法の基礎をなす「確率と統計」における「確率分布」とはどのようなものか。離散分布や連続分布といった種類に分けられるが、その一つである離散分布の例としてベルヌーイ分布と二項分布について見ていく。

()

理化学研究所のスパコン「富岳」を用い、コロナウイルス感染症(COVID-19)に関する飛沫の飛散シミュレーションが実施されている。理化学研究所が独自開発する流体シミュレーションソフトウェア「CUBE」による飛散シミュレーションの概要、注目すべき結果などについて、理化学研究所 計算科学研究センター チームリーダー/神戸大学大学院システム情報学研究科 教授の坪倉誠氏に話を聞いた。

()
キーワードを探す
ページトップに戻る