HyperAI超神経

CVPR20リストを公開! 1,470件の論文が受理され、特定のファーウェイグループが11票中7票を獲得した。

特色图像

本日、コンピュータービジョンカンファレンスのトップである CVPR がランキングを発表し、合計 1,470 件の論文がリストに掲載されました。偉大な巨匠の中には、記録を投稿して観に来る人もいます。

コンピュータービジョンのトップカンファレンスCVPRがランキングを発表!今日の午後、CVPRは採択された論文のIDを発表しました。合計 1,470 件の論文が収録されました。

今年の有効な投稿数は 6656 件です。合格率は22%です——2019年の25%や2018年の29%よりも低い。

許可された論文 ID リストのアドレス:
http://cvpr2020.thecvf.com/sites/default/files/2020-02/accepted_list.txt

CVPR 2020 では、合計 3,664 人の査読者と 198 人のフィールドチェアが論文を審査し、論文の品質を管理していると報告されています。年々応募数が増えても、品質管理は徹底しています。

マスターは成績証明書を共有することを好みます 

このリストは発表後、国内外の学者の間で広範な議論を引き起こした。

Zhihu では、ある著者が 7 つの記事を獲得し、その記録を投稿しました。その喜びが画面にあふれました。

チームは 11 件の記事を投稿し、そのうち 7 件を受賞しました。

Twitter のマスターも喜んで結果を投稿しています。

それを見て、毎年各トップ協会がランキングを発表すると、喜ぶ人もいるし、悲しむ人もいると思いますが、皆さんには良い姿勢で臨んでいただきたいと思います。

応募件数は年々増加していますが、近年は採択率が低下しています。 

コンピュータ ビジョンに関するトップのカンファレンスである CVPR は、近年、有効な投稿数が毎年最高記録を更新しています。

昨年の CVPR 2019 カンファレンスでは、2005 年以前のカンファレンスへの有効な投稿数は 1,000 未満、受理された論文の数は 500 未満であるという一連のデータが発表されました。

しかし、2017 年までに有効な論文投稿数は 2,500 件を超え、2018 年には 3,500 件に増加しました。2019年には直接5,000記事を超えました。

赤いパーセンテージは年間論文採択率です

投稿数は年々増加しているものの、査読者による論文採択率は年々低下傾向にあります。

査読者が CVPR ランキングの発表についてコメントしました。

彼はかつて Weibo で、CV 分野の競争が激しすぎると語った。彼が査読した CVPR 論文の添付ファイルは 20 ページにも及ぶのに対し、カンファレンスで要求された本文はわずか 8 ページだった (参考文献を除く)。この熾烈な競争状況においては、手法の革新が不十分であれば、いくら補足資料を用意しても役に立ちません。

CVPR 2019 クラシック レビュー

収録論文のIDは公式に発表されていますが、論文の詳細情報はまだ発表されていません。リスト公開を機に、CVPR 2019の古典的な受賞作品を振り返ってみましょう。

 最高の紙 

論文アドレス: http://dwz.date/7qa

まとめ: 研究者らは、新しい光フェルマー経路理論、この光は、既知の可視シーンと、一時的なカメラの視線内にない未知のオブジェクトとの間にあります。これらの光路は鏡またはオブジェクトの境界によって反射され、隠れたオブジェクトの形状をエンコードします。

研究者らは、フェルマー経路が過渡測定の不連続性に対応していることを実証しました。その後、彼らは次のことを導き出しました。これらの不連続点におけるパス長の空間導関数をサーフェス法線に関連付ける新しい制約。

この理論に基づいて、研究者たちは次のような方法を提案しました。 視線外のオブジェクトの形状を推定する Fermat Flow のアルゴリズム。この方法は初めて、拡散反射から鏡面反射に至るまで、コーナーやディフューザーの後ろに隠れた複雑なオブジェクトの形状を正確に復元します。

最後に、この方法は、一時的なイメージングに使用される特定の技術から独立しています。したがって、研究者らはSPADと超高速レーザーを使用してピコ秒スケールの過渡状態からミリメートルスケールの形状回復を実証し、干渉法を使用してフェムト秒スケールの過渡状態からミクロンスケールまでの再構成を実現しました。

 最優秀学生論文 

論文アドレス: https://arxiv.org/pdf/1811.10092.pdf

まとめ:Visual Language Navigation (VLN) は、現実的な 3D 環境で具体的なエージェントをナビゲートして自然言語命令を実行するタスクです。

この論文では、研究者たちは、このタスクの 3 つの主要な課題に対処する方法を検討しています。クロスモーダルグラウンディング、不適切なフィードバック、一般化の問題。

まず、彼らは、強化学習 (RL) を介してローカルおよびグローバルにクロスモーダル グラウンディングを実装する、新しい強化クロスモーダル マッチング (RCM) 手法を提案します。特に、マッチング レビュアーは、命令と軌道の間のグローバルなマッチングを促進するための固有の報酬を提供するために使用され、推論ナビゲーターは、ローカルのビジュアル シーンでクロスモーダル グラウンディングを実行するために使用されます。

VLN ベンチマーク データセットの評価では、その RCM モデルが SPL に関して以前の方法を 10% 大幅に上回り、最先端のパフォーマンスを達成していることが示されています。

学んだポリシーの一般化可能性を高めるために、さらに、自己教師あり模倣学習 (SIL) 手法が導入され、自身の過去の正しい決定を模倣することで、目に見えない環境を探索します。

最終的に、SIL は、目に見える環境と目に見えない環境の間の成功率パフォーマンスのギャップを最小限に抑える、より優れた効率的な戦略として近似できることが実証されました (30.7% から 11.7%)。

 ロンゲット・ヒギンズ賞 

さらに、CVPR 2019ではBest Paperを上回っていることも特筆に値します。 Longuet-Higgins Award は、ImageNet の研究「ImageNet: A Large-Scale Hierarchical Image Database」に対して、Deng Jia、Li Feifei、Li Jia らに授与されました。

この紙2009 年に CVPR に掲載され、これまでに 11508 回引用されています。

この論文の誕生から 2 年目に、コンピュータ ビジョンの分野における壮大なイベントである ImageNet チャレンジが始まり、以来、ImageNet はコンピュータ ビジョン認識分野のベンチマークとなり、この分野での大きな進歩を促進してきました。

- 以上 -