ファーウェイが選んだ「天使少年」は
どのような特許を保有している?

2019年、ファーウェイの任正非氏は次のように発表し、「天才少年」プログラムを開始しました。

「今年は世界中から20~30人、来年はさらに200~300人の優秀な若者を採用したいと考えています。これらの優秀な若者たちは、まるで「ドジョウ」のように、私たちの組織に穴を開け、チームを活性化させてくれます。ファーウェイは今後も世界を牽引して独自の基準を作らなければなりません。我々が世界最先端に位置して基準となれば、他の人たちも我々に追いついてくるでしょう。」

もくじ

1. ファーウェイの「天才少年」プログラム

2. 廖明辉氏のバイオグラフィー

3. 廖明辉氏の出願特許4件(うち登録3件)

1. ファーウェイの「天才少年」プログラム


  ファーウェイは「天才少年」プログラムで優秀な若手を採用しています。その給与は3段階に分けられた年俸制に従って支払われ、最高レベルでは年俸201万元(3,400万円)が設定されています。このような高額の給与を得ることは簡単ではありません。通常、7段階の審査(履歴書選考、筆記試験、一次面接、リーダーによる面接、部長による面接、総経理による面接、人事面接)が実施されます。各プロセスでは厳密な評価とスクリーニングが行われ、これは1つの大きな挑戦です。

  今年は、華中科技大学出身の廖明辉氏が「天才少年」プログラムのメンバーに選ばれ、最高年俸201万元を獲得しました。 

お問い合わせはこちら

2. 廖明辉氏のバイオグラフィー


  2012年、廖明辉氏は華中科技大学通信学部の通信工学課程に入学しました。2016年からは修士課程に在籍しコンピュータビジョンを専攻し、シーンテキスト検出の分野で著名な白翔教授のチームに加わりました。白翔教授のチームは、画像内のテキストを正確に見つけて認識する、テキスト検出・認識に取り組んでいます。その用途は、画像検索、コンテンツ審査、自律走行など、非常に多岐にわたります。

  廖明辉氏の研究分野はコンピュータビジョン、自然シーンテキスト検出・認識などで、2018年には、論文『Rotation-Sensitive Regression for Oriented Scene Text Detection』がCVPRに収録されました。CVPR(Conference on Computer Vision and Pattern Recognition)とは、毎年アメリカで開催されるコンピュータビジョンに関する世界トップレベルの学会であり、ICCV、ECCVと並ぶ三大学会の1つです。また、2018年には、別の論文『Feature Fusion for Scene Text Detection』が、パターン認識の分野で最も権威のある国際学術団体の1つであるIAPRに収録されました。

  これまでに、廖明辉氏は2つのトップジャーナル(いずれもESIで引用頻度が高い論文)、7つの著名な学会での論文など、合計10件の論文(筆頭著者)を発表しています。こうした論文のGoogle Scholarでの引用数は1,900を超え、GitHubにおけるオープンソースCodeStarに関する論文の引用総数は3,000を超えています。そして5件の特許出願を行っています。彼が発表したテキスト検出アルゴリズムは、テンセント(WeChat)やBaiduなどで採用され、OpenCVのメインブランチにも収録されました。さらに廖明辉氏は、10件以上の国際的なトップジャーナルや著名な学会のレビュアーを務め、2つの国際コンペの開催にも参加しています。

  最も引用された論文「Textboxes: A fast text detector with a single deep neural network」では、エンド・ツー・エンドで学習可能な、テキスト境界枠を利用した高速シーンテキスト検出技術を公開しています。 

お問い合わせはこちら

3. 廖明辉氏の出願特許4件


  廖明辉の出願した特許5件について調べたところ、4件のみが公開されていました。残りの1件はまだ公開されていないのかもしれません。この4件の内容を調べてみたので、概要を仮訳付きで以下に紹介します。

1) 一种基于可微分二值化的实时文本检测方法

発明の名称:微分可能な二値化に基づく実時間テキスト検出方法
出願番号:CN201911038562.4(2019.10.29)
公開番号:CN110781967A(2020.02.11)
出願人:华中科技大学
発明者:白翔 ;廖明辉 ;万昭祎 ;姚聪 ;
IPC分类号:G06K9/62 ;G06K9/34 ;G06N3/08 ;G06N3/04 ;
Google Patent: https://patents.google.com/patent/CN110781967A/zh?oq=CN110781967A
要約:
本発明は、微分可能な二値化に基づく実時間テキスト検出方法を開示する。画像を分割してテキスト領域の確率画像を求め、この確率画像に対して微分可能な二値化を適用して二値画像を求め、二値画像上の連結領域を見つけることでテキスト領域の境界枠を得る。本方法では、確率画像と二値画像の両方に教師あり学習を適用し、二値化工程を学習に組み込むことで検出効果を向上させている。本発明は、従来のテキスト検出方法に比べて、精度、操作性、汎用性の面で優れた効果を達成しており、実用性の高い応用価値を備えている。
図:以下をご参照ください。 

2) 一种任意形状的场景文本端到端识别方法

発明の名称:任意の形状のシーンテキストのエンド・ツー・エンド認識方法
出願番号:CN201810294058.X(2018.04.04)
登録番号:CN108549893B(2020.03.31)
出願人:华中科技大学
発明者:白翔 ;吕鹏原 ;廖明辉 ;姚聪 ;储佳佳 ;
IPC分類: G06K9/34 ;G06K9/32 ;G06K9/62 ;G06N3/04 ;
Google Patent: https://patents.google.com/patent/CN108549893B/zh?oq=CN108549893B
要約:
本発明は、任意の形状のシーンテキストのエンド・ツー・エンド認識方法を公開する。本方法は、特徴ピラミッドネットワークによってテキスト特徴を抽出し、領域抽出ネットワークでテキスト枠候補を生成する。次いで、高速領域分類回帰ツリーによってテキスト枠候補の位置を調整して、より正確なテキスト境界枠位置情報を取得する。次に、境界枠の位置情報を分割ツリーに入力し、ピクセル投票アルゴリズムによって予測された文字列を取得する。最後に、加重編集距離アルゴリズムによって予測された文字列を処理し、所定の辞書の中で予測された文字列に最もマッチする単語を見つけ、最終的なテキスト認識結果を得る。本方法は、自然画像中の任意の形状のシーンテキスト(横方向のテキスト、多方向のテキスト、曲線のテキストなど)を同時に検出および認識することができ、エンド・ツー・エンド学習を実現する。本発明で提案する検出および認識方法は、従来技術に比べて精度および汎用性の点で優れた効果を達成し、実用的の高い応用価値を備えている。
図:以下をご参照ください。 

3) 一种基于旋转敏感特征的文本回归检测方法

発明の名称:回転反応特徴に基づくテキスト回帰検出方法
出願番号:CN201810195630.7(2018.03.09)
登録番号:CN108427924B(2020.06.23)
出願人:华科技大学
発明者:白翔 ;廖明辉 ;朱臻 ;石葆光 ;许永超 ;杨洋 ;徐培 ;
IPC分類: G06K9/00 ;G06K9/32 ;G06N3/04 ;
Google Patent: https://patents.google.com/patent/CN108427924B/zh?oq=CN108427924B
概要:
本発明は、回転反応特徴に基づくテキスト回帰検出方法を開示する。本方法では、(テキストの)境界枠の回帰処理のために、方向応答畳み込みネットワークによって境界枠の位置情報を得る。次いで、方向応答プール化を通じて、回転検知特徴を境界枠の分類処理のための回転不変特徴に変換し、境界枠がテキストに属するか否かの分類情報を得る。最後に、簡単な後処理を行って検出結果を得る。本方法は、分類と回帰との間で区別して生成した特徴を自然なシーンの写真の中で任意の角度に変化するテキストに適応させ、エンド・ツー・エンド学習を実現する。分類と回帰との間で特徴を共有しないこの方法は、一般的な物体検出の枠組みにも適用することができる。本発明が提案する検出方法は、先行技術のアイデアに対して新規性があり、精度と汎用性などの面で優れた結果を達成し、高い実用性を有する。
図:以下をご参照ください。 

4) 一种基于全卷积网络的多方向场景文本单次检测方法

発明の名称:完全畳み込みネットワークに基づく多方向シーンにおけるテキストの単一検出方法
出願番号:CN201711225391.7(2017.11.29)
登録番号:CN107977620B(2020.05.19)
出願人:华科技大学
発明者:白翔 ;廖明辉 ;朱臻 ;石葆光 ;许永超 ;杨洋 ;徐培 ;
IPC分類: G06K9/00 ;G06K9/32 ;G06K9/62 ;
Google Patent: https://patents.google.com/patent/CN107977620B/zh?oq=CN107977620B
概要:
本発明は、完全畳み込みネットワークに基づく多方向シーンにおけるテキストの単一検出方法を開示する。完全畳み込み単一検出ネットワークモデルを構築することにより、多段階の処理ステップを必要とすることなく、単一ネットワークのみを使用してエンド・ツー・エンド学習を実行することができる。複数のスケールの特徴抽出レイヤーをテキスト境界枠予測レイヤーと組み合わせることで、さまざまなサイズ、アスペクト比、解像度の多方向の自然シーンテキストを検出することができる。また多角形の境界枠にテキストを合わせて背景のノイズを減らすことができる。そして単純な非最大抑制操作を行って最終的なテキスト検出結果を得る。本発明が提案する検出方法は、従来技術に比べて単純かつ効果的な構造を有し、精度、検出速度、およびロバスト性において優れた効果を達成し、高い実用的な適用価値を有する。
図:以下をご参照ください。 

4.まとめ

  IPOMOEAでは、より詳細な情報をお届けできるほか、各種ニーズに応じた中国特許調査サービスをご提供できます。お気軽にご相談ください。

  詳しくはこちら 

特許調査レポートのサンプルをご紹介

今すぐ無料で問い合わせる

報告書作成例は可能な範囲でご提示させて頂きますので、お気軽にお問い合せください。

特許翻訳・技術翻訳IPOMOEA Co.,Ltd.

  • Copyright © IPOMOEA Co., Ltd. All Rights Reserved.

Contact Us

  • 株式会社 IPOMOEA
    〒 924-0878
    石川県白山市末広1-156 (306)

  • 076-220-7091

  • 【受付時間】平日 10:00~18:00

Site Map