月: 2020年12月

12月 29, 2020 グレゴリー・エリアス コメントはありません

チュートリアルELECTRAをゼロからスペイン語用に事前学習する方法 原文:Skim AIの機械学習研究者、Chris Tran.はじめに この記事では、自然言語処理ベンチマークで最先端の結果を達成するために、Transformer事前学習メソッドファミリーのもう一つのメンバーであるELECTRAをスペイン語用に事前学習する方法について説明します。これは、さまざまなユースケースのためのスペイン語のカスタム BERT 言語モデルのトレーニングに関するシリーズのパート III です:Part I: How to Train a RoBERTa Language Model for Spanish from Scratch Part II: How to Train a SpanBERTa Spanish Language Model for Named Entity Recognition (NER) 1.はじめに ICLR 2020では、ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators, a...

12月 28, 2020 グレゴリー・エリアス コメントはありません

チュートリアルNERのためにBERTを微調整する方法 原文:Skim AIの機械学習研究者、Chris Tran.はじめに この記事では、名前付き固有表現認識(NER)のためにBERTを微調整する方法について説明します。具体的には、BERT のバリエーションである SpanBERTa を NER 用に訓練する方法です。これは、さまざまなユースケースのためのスペイン語用カスタム BERT 言語モデルの訓練に関するシリーズの第Ⅲ部の第Ⅱ部である:パートI:ゼロからスペイン語用RoBERTa言語モデルを訓練する方法 パートIII:ゼロからスペイン語用ELECTRA言語モデルを訓練する方法 前回のブログポストでは、私のチームがスペイン語用変換言語モデルであるSpanBERTaをどのように事前訓練したかを説明した。

12月 28, 2020 グレゴリー・エリアス

チュートリアルはじめに 要約化は、自然言語処理における長年の課題である。文書の最も重要な情報を保持しながら短いバージョンを生成するには、重複する情報を避けながら重要なポイントを正確に抽出できるモデルが必要である。幸いなことに、Transformerモデルや言語モデルのプリトレーニングなど、最近の自然言語処理における研究が要約の最先端を進んでいる。本稿では、Text Summarization with Pretrained Encoders (Liu et al., 2019)から、抽出的要約のためのBERTの単純な変形であるBERTSUMを探求する。そして、抽出的要約のための...

12月 28, 2020 グレゴリー・エリアス コメントはありません

トランスフォーマーによる名前付き固有表現認識 はじめにPermalink Part I: スペイン語用RoBERTa言語モデルをゼロから学習した方法 前回のブログ記事では、スペイン語用トランスフォーマー言語モデルであるSpanBERTaを、大きなコーパスに対してゼロから事前学習した方法について説明した。このモデルは、文脈に基づいて、連続する単語の中で正しくマスクされた単語を予測できることを示しました。このブログポストでは、変換モデルの力を本当に活用するために、SpanBERTaを名前付きエンティティ認識タスク用に微調整します。ウィキペディアの定義によると、固有名詞認識(NER)(固有名詞識別、固有名詞チャンキング、固有名詞抽出とも呼ばれる)は、情報抽出のサブタスクの1つで、...

12月 11, 2020 グレゴリー・エリアス

8 Ways News & Content Companies use A.I. to Save Money and Improve UX テクノロジーの影響を理解する最善の方法は、現在の問題を解決するために実際にテクノロジーを適用した具体例、事例を理解することです。以下は、私たちのクライアントである新聞、雑誌、コンテンツ、デジタルメディア企業が、コスト削減とユーザー・エクスペリエンスの向上のために活用している8つの一般的なAIソリューションです。この記事を読めば、A.I.を活用して拡張可能なプロセスを実装することでコストを削減し、コストを増やすことなくユーザー体験を向上させる方法を理解できるはずだ。AIを活用して自動化を促進し、実際に利益を得るためには、適切なデータ、十分な...

12月 9, 2020 グレゴリー・エリアス

AIが解決する6つの問題 85%を超えるデータサイエンス・プロジェクトが、テストから本番へと移行できずにいる。誰もが機械学習/人工知能プロジェクトを始めているとしたら、どこで失敗しているのだろうか? この記事を読めば、AIが解決するのに向いている問題の種類に焦点を当てることができるはずだ。AIを使って自動化を進めることで実際に利益を得るためには、適切なデータ、十分なデータ、データポイントで定義できる方法論が必要であり、チームのワークフローの一部にソリューションを適用したり作り上げたりする方法を理解する上で創造的である必要がある。