ころがる狸

ころがる狸のデータ解析ブログ

【NetworkX+Python】NetworkXの使い方とグラフデータ可視化

こんばんは。先日、Graph Attention Networksに関する解説記事を書きました。ここではグラフデータを読み込んで、グラフの頂点に割り当てられたラベルを予想するというタスクを解きました。データセットには論文の引用関係を示したCoraデータセットを使いま…

【Graph Attention Networks解説】実装から読み解くGAT

こんにちは。機械学習の適用先としては、自然言語処理、画像解析、時系列解析など幅広い分野があるわけですが、今日はグラフ構造に対する機械学習モデルを紹介したいと思います。グラフで表現出るものは多く、例えば人間関係だとか、論文の引用・被引用関係…

【機械学習+材料科学】PyTorchとpymatgenによる物性予測入門

こんばんは。今日は、材料データベースを使った機械学習による物性予測をやってみたいと思います。いわゆるマテリアルズインフォマティクスと呼ばれる分野の話題です。既にQiitaなどを見るとランダムフォレストなどの手法を用いた実例があるわけですが、本稿…

【書評】喜嶋先生の静かな世界(森博嗣)で学ぶ研究作法

こんばんは。ゴールデンウイーク中はひたすらデータ解析をやっていたので、息抜きをしたい気分です。というわけで久しぶりに本の書評をしたいと思います。以前本棚整理をしたときに、自分この本好きだったなぁと思いだす名著を何冊か見つけたのでした。その…

【PyTorch+LSTM】LSTMの仕組みと米国株予測の実装

おはようございます。ゴールデンウイーク最終日です。連休中に時系列データ解析を中心に記事を書き、ARIMAモデル、状態空間モデル、次元圧縮、人口推移の可視化、そして本稿のPyTorchによるLSTMの紹介記事をまとめました。今日このトピックを取り上げた理由…

【日本の人口分布】matplotlibで日本の人口分布を可視化

こんにちは。ゴールデンウィーク4日目です。あっという間に残すところあと1日となりました。昨日、総務省が発表した日本の子供(0~14歳)の人口が39年連続で減少というニュースを見ました。恐らく今後も減少に向かうだろうということが予想されます…

【状態空間モデル】PyStanとpykalmanでダウ平均株価予測

こんにちは。ゴールデンウィーク3日目です。緊急事態宣言が5月末まで延長しそうです。家に籠って勉強なりゲームなりをしています。今日は、状態空間モデルを取り上げます。状態空間モデルでは、実際の観測値とその背後にある真の状態を分けて考えます。真…

【次元削減】株価を二次元に埋め込んでみた(tsne,PCA,MDS)

こんにちは。ゴールデンウィーク2日目の日曜日の昼下がりです。データ解析をしつつ、外に出れない分どうぶつの森で散歩しています・・・ こちらが本日の記事の目次です。時間のない方は結果(差分化あり)だけご覧ください。次元圧縮すると米国株がセクター…

【python+株価+statsmodel】ARIMAモデルでダウ平均株価を解析してみた

こんにちは。ゴールデンウィーク始まりましたね。とりあえずこの5日間は、機械学習・統計解析の勉強をしつつどうぶつの森で島を開拓する予定でいます! ・・・・・・・・・ 今日はpythonで時系列データの解析を行いたいと思います。時系列データというと株…

【マテリアルズインフォマティクス】主要技術一覧

こんにちは。今日は材料と情報科学の融合領域の話題を取り上げたいと思います。材料科学の世界でも機械学習技術の活用は大きく進展しており、このような科学分野を一般にマテリアルズインフォマティクスと総称します。特定の技術のことを指すのではなく、技…