最新記事一覧
プログラミング言語「R」に脆弱性「CVE-2024-27322」が存在すると報じられた。この脆弱性は安全ではないデータシリアライゼーションにより生じ、システム上で任意のコードが実行される可能性がある。
()
RedMonkは2024年第1四半期のプログラミング言語の人気ランキングを発表した。JavaScript、Python、Javaがトップ3を占めた。TypeScriptが順位を1つ上げた一方、C++が順位を1つ下げた。
()
「知識ゼロから学べる」をモットーにした機械学習入門連載の第1回。ルールベースと機械学習ベースの違いから、教師あり学習などの学習方法、回帰/分類などのタスクまで基礎の基礎から説明。機械学習のためのPythonライブラリも概説する。
()
一色からは「執筆者のためのChatGPTの使い方」と「Code Interpreterに見るデータ分析の近未来」について、かわさきからは『ChatGPTの頭の中』(ハヤカワ新書)というお勧め本の概要紹介を書きました。
()
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第5回。分布のばらつきの度合いを表す値として散布度を取り上げ、尺度や分布によって適切な散布度を利用する必要があることを説明します。順序尺度の散布度として使われる四分位範囲と、名義尺度の散布度として使われる平均情報量のお話です。
()
企業がエンジニアに求めるプログラミング言語は何か。企業データベース「SalesNow DB」を運営するQuickWorkは、同データベースが持つ約110万件の求人データから算出したランキングを発表した。
()
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第4回。分布のばらつきの度合いを表す値として散布度を取り上げ、尺度や分布によって適切な散布度を利用する必要があることを説明します。今回は間隔尺度・比率尺度の散布度として使われる分散/標準偏差のお話です。
()
データ分析をビジネスで活用したい人に向け、データ分析の概要と目的、データサイエンスとの違い、メリット、作業フロー、データ分析でできること、データ分析で役立つツールと思考法を、5分で読めるコンパクトな内容で紹介。最後に、次の一歩を踏み出すための参考情報もまとめる。
()
Brocante(東京都渋谷区)は、運営するフリーランスエンジニア専門の案件一括検索サイト「フリーランススタート」において、2022年10月のフリーランス市場月額単価の動向を発表した。22年10月のフリーランス案件の月額平均単価は、63.9万円となった。
()
連載の通常の流れとは別の番外編。前回の行列式に続いて、今回は固有値と固有ベクトルについて、ポイントを押さえて見ていく。名付けて「挫折しない固有値・固有ベクトル」というお話(にするつもり)。統計学や機械学習のさまざまな手法の背景にあるこれらの考え方に触れてみよう。
()
無料で使えるStudio Labは、どうやって使えばよいのか。Studio Labプロジェクトランタイムの起動から、CondaによるPython環境の操作やエクスポートなどについて説明する。
()
メールアドレスだけで無料で使えるStudio Labは、同種のColabとどう違うのか。Studio Labプロジェクトランタイムのスペック(CPU/GPUや、実行時間、メモリ、ディスクサイズなど)や機能(ランタイムの保存と再開など)について説明する。
()
AWSが、機械学習の実行環境を提供する新サービス「SageMaker Studio Lab」を無料で提供する。オープンソースの「JupyterLab IDE」をベースにした新サービスで、PythonやR言語などに対応。Webブラウザから利用可能という。
()
Microsoftは、R言語を使って「Microsoft 365」スイートを操作できるオープンソースパッケージ「Microsoft365R」を発表した。認証やOneDriveの操作、SharePointサイトへのアクセスなどに役立つという。
()
データサイエンスに興味がある技術者の間で話題になった「データサイエンス100本ノック(構造化データ加工編)」。生みの親である森谷和弘氏によると、この取り組みが生まれた背景には「データ分析の最も大きいニーズに応える環境がない」という課題があったという。
()
アメリカのスタンフォード大学/MIT/ハーバード大学/コロンビア大学/ニューヨーク大学といった有名大学の一部では機械学習や深層学習のオンライン講座/講義動画を無料で配信している。その概要と特長をまとめる。
()
日本政府が公開するオープンデータの中でも、機械学習/データサイエンスに活用できるお勧めのデータセットを厳選して紹介する。具体的には「e-Stat(政府統計の総合窓口)」「Tellus(衛星データプラットフォーム)」「過去の気象データ(気象庁)」の3つ。
()
「Goodfellow本」「PRML本」「カステラ本/ESL本」「ISL本」といった通称で愛される、超有名な書籍が無料で読める。厳選したこの4冊のリンク先と概要を紹介する。
()
Pythonや機械学習(ディープラーニング)を学ぶための学習リソースとして、@IT/Deep Insider上にある連載(技術解説記事)を、「Python」「開発環境」「数学/統計/データサイエンス」「ディープラーニング/機械学習」という4つの分野で紹介する(全18連載)。
()
Microsoftは、オープンソースの統計処理言語の最新版「R 3.6.2」の公開と、次期メジャーバージョン「R 4.0.0」の主な新機能について、同社のRコミュニティーブログで紹介した。
()
東芝と情報・システム研究機構 統計数理研究所は、欠損値の多い数値データから高精度な回帰モデルを作る機械学習アルゴリズムを開発した。工場での品質低下や歩留まり悪化の要因分析などに役立てる。
()
Microsoftは、Azureで仮想マシン(VM)をデプロイ、管理するための新版「AzureVM 2.0」を公開した。VMとVMクラスタのデプロイを分離し、これらを作成するためのUIを改善した。
()
「データサイエンティストになりたい」「エンジニアになりたい」――そう思うものの、思っているだけでは夢はかなわない。そんな悩める人に送る独学のすすめ。
()
データドリブン志向の企業は、可視化ツールを使用してビッグデータに潜む結論を読み解き、その結論から有益な情報を導き出す。本稿ではビッグデータ分析に適した可視化ツールと選び方のポイントを紹介する。
()
Facebookが開発した時系列予測のOSSライブラリ「Prophet」が近年注目を集めている。本連載ではProphetの概要と理論的背景、案件で使ってみた経験から得られた知見を紹介する。前編は時系列予測そのものの歴史的経緯とProphetの概要について。
()
Mozillaは、Web上での科学コミュニケーションや探索が可能になる実験ツール「Iodide」のα版を公開した。R Markdownに慣れていればすぐに使いこなすことができるという。
()
企業の取得データが急増している近年では、情報を全て把握するためにもデータサイエンスツールが欠かせない。本稿では「Python」「R」「Jupyter Notebook」「Tableau」「Keras」について、データサイエンティストが愛用する理由を聞いた。
()
データサイエンティストの育成を行うデータミックスが、AIベンチャーのハカルスと共同で、エンジニア向けのデータサイエンティスト育成プログラムを開発した。機械学習やAI開発に関心を寄せるエンジニアが対象。
()
ディープラーニングはプログラムとして作成するが、そもそもプログラムとは何なのか? プログラムに関する基礎の基礎を紹介する。
()
アイティメディアは、2018年9月26日に秋葉原UDXで「AI/ディープラーニングビジネス活用セミナー ビジネス価値は、データに宿る」を開催した。本稿では、マイクロストラテジー・ジャパンの講演「AIの効果を最大化するBIプラットフォーム MicroStrategy」の内容を紹介する。
()
中小企業がSaaSのERPを導入しようとした場合、オンプレミスでの導入よりも多くの問題に直面する。そして、クラウドERPが全ての企業にフィットするとは限らない。
()
人工知能(AI)インフラ市場はまだ歴史が浅く、各社さまざまなツールを市場投入している。クラウドサービスも、パワフルで高価なハードウェアもある。Amazon、Baidu、Clouderaなど、主要な18社を紹介する。
()
DataRobotは市民データサイエンティストの育成プログラム、プロジェクトコンサル、ツールの3つをパッケージングした「AI-Driven Enterprise Package」を2018年4月1日に提供開始する。これにより同社が目指す「AIの民主化」とは何か。
()
医師が診療ガイドラインを策定するための論文検索に深層学習を活用した。用いたのはGoogleが開発した「TensorFlow」。人間の労力を減らし、人間が見落としていたものを発掘するなどの効果が得られた。
()
パーソルテクノロジースタッフは、富士通総研に技術系社員を派遣し、AIエンジニアとして育成した上で就業経験を積ませる「AIエンジニア育成プログラム」を開始する。
()
マイクロソフトが提供する機械学習向け新サービス&ツール。Azure、AWS、GCP、オンプレスミスなどに対応。TensorFlow、Chainerなどのディープラーニングフレームワークに、PyCharmやVisual Studio Codeなどのコードエディターも使える。
()
当社でもAI導入を、と考えると一般的にはまず社内のデータ分析から始める。データ分析用のさまざまな製品やアプリケーションがあるが、今回は無償で開始できるMicrosoft Rを紹介する。
()
データ分析に取り組む企業が、必ずと言っていいほどつまづく「人材」の問題。ビジネスの現場でデータを扱う人材をどう育てればいいのか。その方法を、大阪ガスとホテルおかだの事例から見てみよう。
()
日本オラクルは「Oracle Analytics Cloud」の拡充を発表した。プライベートDMP構築にも活用される同社のクラウド型アナリティクスサービスの展開について、担当者に話を聞いた。
()
@ITの人気連載「開発残酷物語」の山本一郎氏と、「IT訴訟徹底解説」の細川義洋氏がエンジニアのキャリアについて、超真剣に話し合った。
()
Windows 10が、データ量の多いワークロードを処理するため、PC最適化機能を備えたエディションの提供を計画している。機械学習などで大量のデータを扱う企業に有用なアップデートとなりそうだ。
()
日本マイクロソフトは2017年5月23、24日に「de:code 2017」を開催。基調講演後半では、AI、Deep Learning、「Mixed Reality」といった「未来のコンピューティング」を実現するためのテクノロジーと、それに向けてMicrosoftが提供する製品、サービスが多数紹介された。
()
ビッグデータを教育に生かす「ラーニングアナリティクス」に取り組む教育機関が直面しがちな課題とは何か。主要な7つの課題と、その解決策を示す。
()
SSDのリモートDMAを実現する「NVMe over Fabrics」でストレージが高速化する。だが……。外に、サーバOSのトレンドの変化、ソフトウェア定義ストレージのメリット/デメリット、MicrosoftのR言語データ分析プラットフォーム紹介などの記事をお届けする。
()
ウイングアーク1stは、情報活用ダッシュボードの最新版「MotionBoard Ver.5.7」の提供を2017年5月17日に開始すると発表した。
()
「Oracle Databaseで管理しているデータを高度なデータ分析に活用できれば、もっとビジネスの助けになる知見が得られそうなんだけど……」──そんな企業に試していただきたいのが、「機械学習」による高度なデータ分析を可能にするオプション「Oracle Advanced Analytics」だ。既存のデータベースをそのままハイレベルなデータ活用に生かせる手軽さが大きな利点である。[ビッグデータ][Big Data]
()
Rは主に統計解析やその可視化を行うためのオープンソースのソフトウェア環境。さらに機械学習を行うためのツールとしても広く使われている。
()
数学ができるとエンジニアとして活躍できるのか、むしろ数学ができないとエンジニア失格なのか?――「エンジニアに数学の知識は必要か?」を、数学オタクが論理的に解説します。
()
多くの企業は、今日のビッグデータとデータサイエンスがもたらすチャンスを認識しているが、一方でそのエコシステムの複雑さに手を焼いている。
()