CV CG CP ML CMOS

nvidia-smiでのCUDAのバージョンが、dockerコンテナのバージョンじゃなくホスト側のバージョンが表示されてしまうのはバグではなく仕様なのか。https://t.co/43dsu26JNq
— Teppei Kurita (@kuritateppei) 2021年5月24日

"コンテナ内のユーザがホストの一般ユーザとuid、gidが同一の場合、そのユーザはホスト側のユーザと同一になる"
なるほど。

Dockerコンテナ内のユーザとホストのユーザとの関係についてhttps://t.co/VkmcDkbZau
— Teppei Kurita (@kuritateppei) 2021年5月24日

Docker、公式の説明が一番わかりやすいな。

イメージ、コンテナ、ストレージ・ドライバの理解https://t.co/lhBUMyv91d
— Teppei Kurita (@kuritateppei) 2021年5月22日

Noise2Noiseを16bitの入出力画像に対応。https://t.co/sNF0yhonYd
— Teppei Kurita (@kuritateppei) 2021年5月18日

【Keras】エラー 'str' object has no attribute 'decode'について https://t.co/1lcHJdJTcJ #Qiita
— Teppei Kurita (@kuritateppei) 2021年5月18日

リモートのVimからssh越しにクリップボード書き込み - tateren’s diary https://t.co/Cy41kMDM8f
— Teppei Kurita (@kuritateppei) 2021年5月18日

闇だな。

・TensorFlow 2.4 GPU 版での，NVIDIA CUDA のバージョンは，11.0 が良いようである
・TensorFlow 2.3, 2.2 GPU 版での，NVIDIA CUDA のバージョンは 10.1 が指定されている
・TensorFlow 1.15 GPU 版での，NVIDIA CUDA のバージョンは 10.0 が指定されている．https://t.co/5gw4pgDnSU
— Teppei Kurita (@kuritateppei) 2021年5月17日

わかる範囲で更新。
SVBRDF推定等も今後追加する予定。https://t.co/QkHocpVBD3
— Teppei Kurita (@kuritateppei) 2021年5月15日

CVPR採択等を更新。https://t.co/msVnDi4Oqk
— Teppei Kurita (@kuritateppei) 2021年5月14日

torch.clip (torch.clampのエイリアス)なんていつ出来たんだと思ってドキュメント見たら1.7から追加されたっぽい。numpyとの変換が楽になりましたね。https://t.co/967E6sbaWq
— Teppei Kurita (@kuritateppei) 2021年5月12日

人間のインタラクションの映像のみから物理的制約のない弱教師視線推定を行う初めての試み。その方法が個人的には面白く、人同士が互いに「見つめあう」動作をする際には視線に関連する強い幾何学的制約が存在するという洞察を利用している。ドメイン間の一般化を大幅に改善。https://t.co/4RUh2AgRxC pic.twitter.com/IkZPIftFmi
— Teppei Kurita (@kuritateppei) 2021年5月31日

鳥等の動物の３D形状を取得するのは協力的ではないので難しい。そこで形状の事前情報が得られない場合でも、種毎の画像のコレクションのみから様々な鳥類の種固有の詳細な形状モデルを復元する手法を提案。また鳥類の各種の統計的形状モデルを提供、形態的特徴を捉えている。https://t.co/VKY2iBWBfb pic.twitter.com/PQbiCfXIiq
— Teppei Kurita (@kuritateppei) 2021年5月27日

1万枚以上からなる大規模かつ高品質なレタッチ用のポートレート写真のデータセット。シーン・被写体・照明条件・カメラ設定が多岐にわたる。各写真は３人のエキスパートレタッチャーによる３つのレタッチ済み画像を含む。さらに高解像度の人物領域のマスクも提供。すごい。https://t.co/o1Sfn0OoOf pic.twitter.com/yz0OSAFKq2
— Teppei Kurita (@kuritateppei) 2021年5月25日

誤分類率やリコールなどの任意のタスク評価指標を微分可能な価値関数を用いて直接最適化する。価値関数は評価指標に関する有用な監視または勾配を提供するためにメタ学習される。勾配ベースの最適化なので、既存のオプティマイザーに価値関数を適用することが容易とのこと。https://t.co/bTIf2SWlGo pic.twitter.com/xoHHssUzcC
— Teppei Kurita (@kuritateppei) 2021年5月22日

粗いレイアウトから複雑なシーンを合成する。従来手法はマスクジェネレータのような補助的な損失や中間ステップに依存しているため高解像度の合成で失敗する。そこで追加の目的関数を持たない純粋な尤度学習をベースにした手法を提案、高品質な512x512の画像合成が可能。https://t.co/VVktSomAX3 pic.twitter.com/fKSk2NQzRh
— Teppei Kurita (@kuritateppei) 2021年5月19日

複雑な屋内シーンの大規模なフォトリアリスティックなデータセット（を作成するためのフレームワーク）。従来のとは違い複雑な素材や空間的に変化する照明に対して画素毎の環境マップ等の高品質なGTを提供する。インバースレンダリングはもちろん様々な他の用途にも使える。https://t.co/9ESoGtP4cb pic.twitter.com/PHYIOGefA2
— Teppei Kurita (@kuritateppei) 2021年5月18日

与えられた画像からもっともらしい未来の進行を予測し合成する。画像→映像の合成を反転可能な領域移動問題と捉え条件付き可逆NNで実装。画像/動画のドメインギャップを考慮し確率的残差表現を導入、マッピングの双対性により初期フレームの相補的な情報のみが取り込まれる。https://t.co/6PjULVE7di pic.twitter.com/M2KDKqu2fK
— Teppei Kurita (@kuritateppei) 2021年5月17日

単眼画像のシーケンスから3DシーンフローとDepthを自己教師で推定する。従来手法のデコーダ設計の限界を指摘し、学習が安定するようなsplitデコーダに変更し、また3Dシーンフローの時間的な一貫性を利用しConvLSTMを介して以前の推定値を伝搬させていることが技術的なキモ。https://t.co/YXEdAisZIM pic.twitter.com/TF0BsnVMMY
— Teppei Kurita (@kuritateppei) 2021年5月13日

人間は環境を立方体/円筒/楕円などの単純な幾何学的形状(プリミティブ)の配置として視覚的に抽象化していると考えられている。そこで１枚のRGB画像からプリミティブを推定するためのロバストな推定気を提案。現実世界の3Dシーンのレイアウトを上手く抽象化することができる。https://t.co/0z9aGxFF5q pic.twitter.com/vXSYqmMGqa
— Teppei Kurita (@kuritateppei) 2021年5月12日

多くの物体は「対称性」を持ちそれが様々な３Dタスクに役に立つことが知られている。そこで3D物体の対称面(鏡面法線)を検出することを提案。検出された対称面はポーズ推定やDepth推定等のタスクの性能を向上させることができる。密な特徴マッチングを活用したことがキモ。https://t.co/Gu7XLrYPUh pic.twitter.com/rSTl5TtVRd
— Teppei Kurita (@kuritateppei) 2021年5月11日

衛星画像を使いNeRFで地表の測量をする。LiDARを使わず光学センサのみで測量可能なのでコストが安くなる。そのままNeRFを適用するだけだと衛星画像は異なる時間に撮影されたものであるため影の影響を受け破綻することがある、そこで明示的に光輸送モデルを用いて影響を低減。https://t.co/xSpaXjLETm pic.twitter.com/jd3X8GlScd
— Teppei Kurita (@kuritateppei) 2021年5月10日

Inpaintingにおいて多様な結果を生成するPD-GANの提案（バニラGANがベース）。穴領域の現実性と多様性を動的にバランスを取り、生成されるコンテンツを穴の中心に向かってより多様化し、穴の境界ではより近傍のコンテンツに類似するようにDeepな特徴を修正するSPDNormがキモ。https://t.co/820PS8Zs7h pic.twitter.com/LYgcgSkjqz
— Teppei Kurita (@kuritateppei) 2021年5月8日

自己教師単眼Depth推定の多くはTest時のビデオフレームのシーケンス情報を利用していないことを指摘。そこでTest時の複数画像に対応した完全な自己教師Depth推定を提案。マルチフレームと単眼Depth推定双方の手法の利点を得て移動物体や静止カメラに対してよりロバスト。https://t.co/XmEXDFHyXc pic.twitter.com/KeNHuAIt8r
— Teppei Kurita (@kuritateppei) 2021年5月7日

人体のボリュメトリックキャプチャを非常に簡易な構成(RGBDカメラx3～)で軽量に行う。既存手法よりも数桁早い速度。RGBD情報を十分に活用にするよう設計された陰関数がキモ。黒髪のようなDepthが推定しずらい特定の素材には弱い。様々なポーズと服装データセットも公開予定。https://t.co/o1k1dCRQQk pic.twitter.com/DFTvkn1xx6
— Teppei Kurita (@kuritateppei) 2021年5月6日

カモフラージュされた物体の識別をするために自然界の捕食者の捕食プロセスを模倣し、ポジショニングモジュール(PM)とフォーカスモジュール(FM)からなるフレームワークの提案。PMはグローバルな視点からターゲットの位置決めをし、FMは曖昧な領域に焦点を当て発見・除去する。https://t.co/AxfIhjYBIv pic.twitter.com/ykdc7fQz08
— Teppei Kurita (@kuritateppei) 2021年5月5日

Depth推定(補完)を効率的に行うために画素の絶対Depthを2パラメータ(p,r)で表現することの提案。pは予め定義された離散化されたDepth Planeでrは平面からの距離を表す。この表現により難しいDepth回帰問題が比較的簡単な平面の分類と平面毎の残差回帰の二問題に分解できる。https://t.co/5LUKmUgBe0 pic.twitter.com/nN10YgSMgy
— Teppei Kurita (@kuritateppei) 2021年5月3日

CV CG CP ML CMOS

2021年5月技術メモ

2021年5月文献/技術記事解説