ころがる狸

ころがる狸のデータ解析ブログ

スコアベース拡散モデルの概要

こんにちは。前回に引き続き、拡散モデルに関する話題を取り上げます。拡散モデルとはGoogleのImagen等に活用されている話題の生成モデルであり、一部のタスクでは最も研究が進んでいる生成モデルGAN(敵対的生成ネットワーク)の最高性能を上回ることが報告…

【エネルギーベースモデル】EBMの仕組みと拡散モデルとのつながり

こんにちは。今回は、深層学習における生成モデルの1つであるエネルギーベースモデル(EBM)について解説します。EBMは深層学習のブレイク以前からある伝統的な技術ですが、最近Googleが発表したImagen等の超高精度生成モデルで使われる拡散モデルと深い関…

【生成モデル】正規化フローでMNISTの画像生成

こんにちは。育児のため時間がとれずブログ更新を1年放置していました。今後はしっかりと勉強時間を確保して、記事執筆を頑張っていきたいと思います!さて、今回は機械学習分野でもっとも注目を集めている技術の1つである生成モデルを取り上げます。生成モ…

【gMLP解説】イラストで理解する最新の機械学習モデルgMLPの仕組み

ここ数年、機械学習分野では自己注意(self-attention)と呼ばれる仕組みに基づいた学習モデルが様々なアプリケーションに適用され、その性能・汎用性の高さから大きな注目を集めていました。代表的なモデルがTransformerと呼ばれるもので確固たる地位を築いて…

【PyTorch+Numpy】Dataloaderに潜むありがちなバグ

PyTorchは素晴らしい機械学習フレームワークですが、データ読み込みに使うDatasetとNumpyによる乱数発生の組み合わせは思わぬバグの発生源となっているようです。2021年4月10日に投稿されたこちらの記事がTwitter上で話題になっています。 tanelp.github.io …

【分子可視化ツール】VMDのインストールと基本的な使い方

材料や創薬は歴史のある学問ですが、機械学習技術はこれらの分野にも適用され今もなお大きく進化しています。もともとシミュレーションが活発な分野なので、材料・創薬分野の機械学習エンジニアを目指すならそれらの知識も必須です(例えば第一原理計算、分…

【EfficientNetV2】軽量・高精度な最新の画像認識モデルを解説!

機械学習を使った画像認識モデルの進化が止まりません。2019年以降に絞ってみても、EfficientNet, Big Transfer, Vision Transformerなど数多くのモデルが提案され、当時最高の予測精度が報告されてきました。そして最近になり注目を集めているのが、従来手…

【FastAPI】csvデータを取得可能なWebAPIの実装!

ビッグデータに基づいた研究開発やビジネスは現代において珍しくありません。そんな中重要視されるのが、簡単にデータを取得できる仕組み【WebAPI】です。WebAPI(Web Application Programming Interface)はプログラムによってWeb上のデータベースから容易…

一次元畳み込みニューラルネットワークとハイパラ探索

機械学習の分野で最も有名なモデルに畳み込みニューラルネットワーク(CNN)と呼ばれるものがあります。2012年にCNNが画像認識処理において卓越した性能を示したことで科学や生活の在り方は大きく変わりました。この手法は画像(2次元データ)のみならず波形…

【Streamlit】株価データのお手軽GUI分析

手元のデータを簡単に分析するためのツールが欲しいと思うことはありませんか?既存の解析ツールでは手の届かない細かい機能を簡単に実装できれば、ちょっとしたビジネスインテリジェンス(BI)ツールや株式運用ツールとして役立ちそうです。Pythonを使った…