ころがる狸

ころがる狸のデータ解析ブログ

【Matplotlib】図の枠線の太さを調整する方法

こんにちは。今日は、Matplotlibの作図方法について取り上げます。これについては既に多くの日本語記事が存在していますが、最近Matplotlibでの図の枠線の太さの変え方で大いに悩んだため、いくつかのケースについて記事にしてまとめることにしました。論文…

【NetworkX+Python】NetworkXの使い方とグラフデータ可視化

こんばんは。先日、Graph Attention Networksに関する解説記事を書きました。ここではグラフデータを読み込んで、グラフの頂点に割り当てられたラベルを予想するというタスクを解きました。データセットには論文の引用関係を示したCoraデータセットを使いま…

【Graph Attention Networks解説】実装から読み解くGAT

こんにちは。機械学習の適用先としては、自然言語処理、画像解析、時系列解析など幅広い分野があるわけですが、今日はグラフ構造に対する機械学習モデルを紹介したいと思います。グラフで表現出るものは多く、例えば人間関係だとか、論文の引用・被引用関係…

【機械学習+材料科学】PyTorchとpymatgenによる物性予測入門

こんばんは。今日は、材料データベースを使った機械学習による物性予測をやってみたいと思います。いわゆるマテリアルズインフォマティクスと呼ばれる分野の話題です。既にQiitaなどを見るとランダムフォレストなどの手法を用いた実例があるわけですが、本稿…

【書評】喜嶋先生の静かな世界(森博嗣)で学ぶ研究作法

こんばんは。ゴールデンウイーク中はひたすらデータ解析をやっていたので、息抜きをしたい気分です。というわけで久しぶりに本の書評をしたいと思います。以前本棚整理をしたときに、自分この本好きだったなぁと思いだす名著を何冊か見つけたのでした。その…

【PyTorch+LSTM】LSTMの仕組みと米国株予測の実装

おはようございます。ゴールデンウイーク最終日です。連休中に時系列データ解析を中心に記事を書き、ARIMAモデル、状態空間モデル、次元圧縮、人口推移の可視化、そして本稿のPyTorchによるLSTMの紹介記事をまとめました。今日このトピックを取り上げた理由…

【日本の人口分布】matplotlibで日本の人口分布を可視化

こんにちは。ゴールデンウィーク4日目です。あっという間に残すところあと1日となりました。昨日、総務省が発表した日本の子供(0~14歳)の人口が39年連続で減少というニュースを見ました。恐らく今後も減少に向かうだろうということが予想されます…

【状態空間モデル】PyStanとpykalmanでダウ平均株価予測

こんにちは。ゴールデンウィーク3日目です。緊急事態宣言が5月末まで延長しそうです。家に籠って勉強なりゲームなりをしています。今日は、状態空間モデルを取り上げます。状態空間モデルでは、実際の観測値とその背後にある真の状態を分けて考えます。真…

【次元削減】株価を二次元に埋め込んでみた(tsne,PCA,MDS)

こんにちは。ゴールデンウィーク2日目の日曜日の昼下がりです。データ解析をしつつ、外に出れない分どうぶつの森で散歩しています・・・ こちらが本日の記事の目次です。時間のない方は結果(差分化あり)だけご覧ください。次元圧縮すると米国株がセクター…

【python+株価+statsmodel】ARIMAモデルでダウ平均株価を解析してみた

こんにちは。ゴールデンウィーク始まりましたね。とりあえずこの5日間は、機械学習・統計解析の勉強をしつつどうぶつの森で島を開拓する予定でいます! ・・・・・・・・・ 今日はpythonで時系列データの解析を行いたいと思います。時系列データというと株…

【マテリアルズインフォマティクス】主要技術一覧

こんにちは。今日は材料と情報科学の融合領域の話題を取り上げたいと思います。材料科学の世界でも機械学習技術の活用は大きく進展しており、このような科学分野を一般にマテリアルズインフォマティクスと総称します。特定の技術のことを指すのではなく、技…

【pythonテクニック】説明文(docstring)でコードを読みやすく!

こんにちは。今日(2020/4/29)も天気がいいですね。窓をあけながら記事を書いています。皆さん、プログラムを書くときにdocstringはきちんと書いていますか?そもそもdocstringという単語を聞いたことはあるでしょうか。githubで有名ライブラリのコードを読…

【本棚整理・読書感想】フラニーとズーイ(J.D.サリンジャー,村上春樹訳)

こんばんは。先ほどまで大雨が降っていました。昨日今日と東京都の感染者数が100人を下回ったとのことですが、外出自粛の効果が出てきたのでしょうか。<注:書評は本記事の後半にあります> 本棚整理 週末はもうあんまり暇だったもので、我が家にある私の本…

【海外旅行・観光】スウェーデンはヨーテボリ

こんにちは。今日はゴールデンウィーク初日とのことですが、コロナ禍のせいで毎日家にいるため連休感がありません(汗)もちろん旅行などできませんので、今日は過去の旅行記を書こうと思います。 美しい北欧の街 今から数年前に、スウェーデンのヨーテボリ…

新型コロナ:石川と福井の感染者数

こんばんは。早くも今週が終わりました。在宅勤務をしていると時間の流れが早く感じられます。最新版ということで、4月23日現在の47都道府県の1万人当たりの感染者数です。トップ5は東京、石川、大阪、福井、富山ですが、やはり北陸3県の感染割合が高いの…

新型コロナ:全国の感染者割合と人口密度

こんばんは。とりあえず今日はこの図を1枚ペタリ。石川県と福井県の感染者割合が目を引きます。人口密度が低いわりに1万人あたりの感染者数が全国2番目と3番目です。初期にクラスターが発生したか、スーパースプレッダが感染を拡大させた可能性が疑われ…

新型コロナ:東京都の市区別の感染者割合

こんばんは。本日2本目の新型コロナに関する分析を行いました。いつの間にか東京都のコロナ対策サイトに市区別の感染者数が掲載されていたので、それを分析してみました。もちろん市区ごとに人口が異なるため、単に感染者数が多いからといってその市区が特に…

新型コロナ:東京都の感染者数と検査人数の分析

こんばんは、本日も在宅勤務で家から一歩も出ていません。明らかに不健康です。一日12時間くらい座っています。 本日は新型コロナ、COVID19のデータを可視化します。緊急事態宣言が出てから2週間が経過しました。そろそろその効果が出始める頃でしょうか…

【機械学習+外挿】機械学習モデルで外挿してみた

こんばんは。今日も機械学習を使った実験です。一般に機械学習は内挿は得意ですが外挿は苦手だと言います。というわけで、sin関数の一部を学習させ、外挿するとどうなるのかを実験して確かめることにしました。予測誤差を出力できるガウス過程回帰に加えて、…

【ガウス過程回帰】カーネルの紹介とボストン住宅価格予測

こんばんは。最近、ガウス過程回帰(Gaussian Process Regression, GPR)なる技術を勉強する機会がありました。誤差付きで予測できる便利な技術、と理解していますがGPRとニューラルネットワーク(NN)はどちらが予測精度が高いの?という素朴な疑問があった…

はてなブログ:自己紹介欄の追加方法

こんばんは。データ解析用のネタ記事を作っているのですが時間がかかり今日は公開できなそうです。なので気軽に、はてなブログの自己紹介欄の追加方法を紹介します。 自己紹介欄って? 下の図の、名前の下にある説明文です。これを追加する方法を見つけるの…

【pythonデコレータ入門】3分で理解するデコレータ

こんにちは。外は珍しく大雨で、朝からなかなか降りやみません。もともと外出自粛していましたが、こんな時は家に籠るに限ります(最近は籠ってばかり)。本投稿では、Pythonプログラミングをする上で有用ですがなかなか使いこなせないデコレータについて説…

【回帰モデル使い分け】線形重回帰、SVR、RF...

社会はコロナ禍の最中にありますが、それでも地球は回ると言いますか、コートのいらない気持ちの良い季節になりました。皆様、いかがお過ごしでしょうか? いきなりですが、シミュレーションデータなり、実測データなりが与えられたとします。それを分析して…

COVID19:4月15日の東京都の新型コロナ感染状況

こんばんは。在宅勤務で一日中パソコンの前にいるだじろです。皆さん健康ですか?心と体の健康に気を付けて、コロナに負けないようにしたいですね。 4月15日までの東京都の感染状況と、指数関数によるフィッティングの結果です。黒線は11日にプロットしたも…

【ミニバッチ学習と学習率】低バッチサイズから始めよ

こんにちは。私は業務で3年ほど深層学習を扱っておりますが、まだまだ学ぶことが多いと感じています。深層学習ではGANのような魅力的な飛び道具も多くありますが、今日は学習率とバッチサイズという深層学習の基本的かつ重要なノウハウついて書いてみたいと…

COVID19:東京都の感染者数と人口ピラミッド

最近は在宅勤務でずっと家にこもっています。仕事でデータ分析、ブログでデータ分析と1日中パソコンに向かっています。これってあんまり良くないですよね(汗)。 以前東京都の感染者を年代・性別に分けてプロットしました。そもそも人口分布が分からなけれ…

COVID19 : 感染者数と検査人数

東京都のコロナ感染者数と検査人数をプロットしました。ソースはこちらになります。:https://stopcovid19.metro.tokyo.lg.jp/ このサイトで感染者数はcsvで取れるのですが、検査人数はなかったので1つ1つエクセルに打ち込こんでデータを再現しました。csvで…

新型コロナ感染状況を見える化

東京、埼玉、神奈川、千葉の4都県の感染状況を見える化しました。ソースデータは以下のものを使わせて頂きました。 東京都 https://stopcovid19.metro.tokyo.lg.jp 埼玉県 https://saitama.stopcovid19.jp 千葉県 https://covid19.civictech.chiba.jp 神奈川…

【博士と就職】学位取得後の進路を考える

こんばんは。今日は博士号取得後の進路について考えてみようと思います。特にアカデミアに残らずに就職を考えている方に向けた記事になります。私自身は、材料科学分野で博士号を取得した後、現在は都内のIT企業でソフトウェア開発、あるいは調査業務に携わ…

【D進】博士進学を決める前の3つのポイント

私は数年前に材料分野の博士号(工学)を取得しました。修士と合わせて5年間に渡り大学院で研究し、今は民間企業で働いています。そこで経験した研究生活の苦楽を元に、博士課程への進学を考えている人が満たすべき条件についてまとめてみました。もちろん色…