ころがる狸

ころがる狸のデータ解析ブログ

【機械学習+材料科学】PyTorchとpymatgenによる物性予測入門

こんばんは。今日は、材料データベースを使った機械学習による物性予測をやってみたいと思います。いわゆるマテリアルズインフォマティクスと呼ばれる分野の話題です。既にQiitaなどを見るとランダムフォレストなどの手法を用いた実例があるわけですが、本稿…

【書評】喜嶋先生の静かな世界(森博嗣)で学ぶ研究作法

こんばんは。ゴールデンウイーク中はひたすらデータ解析をやっていたので、息抜きをしたい気分です。というわけで久しぶりに本の書評をしたいと思います。以前本棚整理をしたときに、自分この本好きだったなぁと思いだす名著を何冊か見つけたのでした。その…

【PyTorch+LSTM】LSTMの仕組みと米国株予測の実装

おはようございます。ゴールデンウイーク最終日です。連休中に時系列データ解析を中心に記事を書き、ARIMAモデル、状態空間モデル、次元圧縮、人口推移の可視化、そして本稿のPyTorchによるLSTMの紹介記事をまとめました。今日このトピックを取り上げた理由…

【日本の人口分布】matplotlibで日本の人口分布を可視化

こんにちは。ゴールデンウィーク4日目です。あっという間に残すところあと1日となりました。昨日、総務省が発表した日本の子供(0~14歳)の人口が39年連続で減少というニュースを見ました。恐らく今後も減少に向かうだろうということが予想されます…

【状態空間モデル】PyStanとpykalmanでダウ平均株価予測

こんにちは。ゴールデンウィーク3日目です。緊急事態宣言が5月末まで延長しそうです。家に籠って勉強なりゲームなりをしています。今日は、状態空間モデルを取り上げます。状態空間モデルでは、実際の観測値とその背後にある真の状態を分けて考えます。真…

【次元削減】株価を二次元に埋め込んでみた(tsne,PCA,MDS)

こんにちは。ゴールデンウィーク2日目の日曜日の昼下がりです。データ解析をしつつ、外に出れない分どうぶつの森で散歩しています・・・ こちらが本日の記事の目次です。時間のない方は結果(差分化あり)だけご覧ください。次元圧縮すると米国株がセクター…

【python+株価+statsmodel】ARIMAモデルでダウ平均株価を解析してみた

こんにちは。ゴールデンウィーク始まりましたね。とりあえずこの5日間は、機械学習・統計解析の勉強をしつつどうぶつの森で島を開拓する予定でいます! ・・・・・・・・・ 今日はpythonで時系列データの解析を行いたいと思います。時系列データというと株…

【マテリアルズインフォマティクス】主要技術一覧

こんにちは。今日は材料と情報科学の融合領域の話題を取り上げたいと思います。材料科学の世界でも機械学習技術の活用は大きく進展しており、このような科学分野を一般にマテリアルズインフォマティクスと総称します。特定の技術のことを指すのではなく、技…

【pythonテクニック】説明文(docstring)でコードを読みやすく!

こんにちは。今日(2020/4/29)も天気がいいですね。窓をあけながら記事を書いています。皆さん、プログラムを書くときにdocstringはきちんと書いていますか?そもそもdocstringという単語を聞いたことはあるでしょうか。githubで有名ライブラリのコードを読…

【本棚整理・読書感想】フラニーとズーイ(J.D.サリンジャー,村上春樹訳)

こんばんは。先ほどまで大雨が降っていました。昨日今日と東京都の感染者数が100人を下回ったとのことですが、外出自粛の効果が出てきたのでしょうか。<注:書評は本記事の後半にあります> 本棚整理 週末はもうあんまり暇だったもので、我が家にある私の本…