第1部 AIによる特許情報処理:基盤となるテキストマイニング技術
(2019年9月17日 10:00〜11:00)
ビッグデータの時代になっても、なかなか活用が進まないのが、テキストを代表とする非構造化データである。活用がうまくいかないケースを調べてみると、分析の手間を減らそうと、処理対象のデータを限定して逆効果になっている場合が多い。本セミナーでは、データ資産の最大限の活用を促すために、処理対象データが多いほど分析の手間が減り良い分析結果を得られるようになるテキストマイニングの手法を解説する。
- テキストマイニングの基本
- ビッグデータを活かすためにテキストマイニングが可能にすること
- 検索や分類とテキストマイニングの違い
- テキストマイニングの基本的な仕組み
- 実データ適用事例のデモで示すテキストマイニングの具体的効果
- テキストマイニングの難しさと活用のポイント
- テキストマイニングのための自然言語処理
- テキストマイニングのための分析技術
- テキストアナリティクスの発展動向
- 評判分析
- 会話分析
- マルチモーダル分析
- テキストアナリティクスを用いた特許情報分析
第2部 AIによる特許情報処理:特許文書の分析技術
(2019年9月17日 11:10〜12:10)
大量の特許文書を解析するために、人工知能の一分野である自然言語処理のアプローチを用いた特許分析の手法が近年多く提案されている。特許文書は多くの情報を含むため、一概に特許分析といっても目的や手法は多様である。このため、分析目的に応じて特許文書の特性を反映した手法を選択する必要がある。本セミナーでは、特許分析を行う上で重要な各種情報を特許文書から抽出する手法をいくつか紹介する。
- 特許分析における自然言語処理
- 特許の品質評価
- 特許の品質とは
- 特許の成立可能性の予測モデル
- 重要性の高い特許の候補抽出
- 特許からの各種情報抽出
- 特長表現の抽出
- 特許の構造を利用した情報抽出
- 特許文書集合からの語彙間の意味関係抽出
- 手がかり表現を用いた関係抽出
- 特許の構造を利用した関係抽出
第3部 AIを駆使して新たな技術戦略を導く特許文書アウェアネス
(2019年9月17日 12:50〜14:20)
特許の文章情報を対象に分析する手法として、文章に含まれる単語を抽出することで全体の記述傾向を把握するテキストマイニング技術が知られていますが、本講座では、テキストマイニングにPLSA (確率的潜在意味解析) やベイジアンネットワークという複数の人工知能技術を応用して開発した新たなテキスト分析技術と、それを特許文書データに適用した分析事例をご紹介します。人間では読み切れない特許文書でも、その概要をいくつかのトピックに集約して解釈を容易にし、また特許情報に潜むトレンドの特徴や競合他社の動向、用途と技術の関係性などを可視化することができ、企業の技術戦略の検討において新たな気づきの獲得が期待できます。
- 人工知能技術を応用した新たな特許文書分析
- 従来の特許文書分析と課題
- 人工知能技術の応用
- 新たなテキスト分析技術:Nomolytics
- Nomolyticsを適用した特許分析事例
- 「風・空気」に関する特許文書データ
- トピックの抽出
- トピックのスコアリング
- 出願年×トピックによるトレンド分析
- 出願人×トピックによる競合分析
- 用途×技術の関係分析<その1>~用途⇒技術の関係~
- 用途×技術の関係分析<その2>~技術⇒用途の関係~
- Nomolyticsによる特許文書分析のまとめ
- 新たなトピックモデル技術:PCSA
- PCSAを適用した特許分析事例
- 「車・電気」に関する特許文書データ
- PLSAによる全体のトピックの抽出
- PCSAによる出願年の特徴トピックの抽出
- PCSAによるPIスコアの特徴トピックの抽出
- PCSAによる出願人の特徴トピックの抽出
- まとめ
- AIを応用した次世代テキスト分析技術~NomolyticsとPCSA~
- ビッグデータからインサイト獲得のためのススメ
第4部 機械学習による特許分類モデルの解釈とその実践
(2019年9月17日 14:30〜16:00)
『特許文書の自動分類』という課題は、自然言語処理や機械学習といった諸手法が交差する応用分野として多大な関心が寄せられており、実用的にも大きな価値を持つものです。本講では、文書自動分類のための主要技術を解説するとともに、機械学習モデルのブラックボックス性を解消しようと試みる『解釈性』の概念を紹介します。
- “why?” 機械学習×特許情報
- 機械学習に何ができる?
- 基本にして厄介な課題:特許文書の自動分類
- 機械学習とAI, 関連する諸概念
- “how?” 機械学習×特許情報 手法編
- 特許文書の情報を機械学習に適用させるために
- traditional な手法 : 文書ベクトル, 回帰モデル, …
- progressive な手法 : Word Embedding, Deep Learning, …
- 機械学習モデルの解釈性とは?
- “解釈性“の概念、その背景にあるもの
- “解釈“を編み出すための諸手法
- “how?” 機械学習×特許情報 実践編
- フリー, オープンソースツールによる実践
- NTTデータ数理システムの取り組み
- 必要なスキルセット
第5部 商品コンセプトの創出を行う人工知能の研究と実用化事例
(2019年9月17日 16:10〜17:40)
多くの事業は練りに練ったコンセプトを具現化したものであるため、優れたコンセプトの創出はイノベーションの鍵を握る。講演者はコンセプトの創出を自動化する人工知能技術を研究し、複数の企業で実用化してきた。本講座では、創造性と人工知能の関係について概観したのち、講演者の技術と実用化事例を述べ、最後に講演者の人工知能を用いたワークショップの簡易版を体験していただく。
- 創造性の自動化を目指した研究の動向
- コンセプト自動生成の重要性と研究動向
- 講演者の研究しているコンセプト自動生成技術
- コンピューターで扱えるコンセプトの形式
- 成功したコンセプトをコンピューターが学ぶ手法
- 学習済みのコンピューターによるコンセプトの自動生成
- コンセプト自動生成技術の評価結果
- 過去のヒット商品を表す文書データによる評価
- 実用化事例とコンセプト生成以外への応用例
- アイデア創出ワークショップ
- スマートフォンアプリによるアイデア創出
- 意外性のある小説のストーリー生成支援
- 目を惹く広告キャッチコピーの生成支援
- 利用者の声
- ワークショップの体験 (短時間ですが実際に簡易版のワークショップにご参加いただけます)
- まとめ