OpenAIは12月7日から12日間連続で新機能について発表すると公表しました。
御礼!ついに2冊連続10万部突破しました PR
Day1 OpenAI o1 and o1 pro mode
初日は OpenAI o1 and o1 pro mode を発表しました。
1日目の内容は以下の通り
① o1 pro mode
数学・コーディング・大学院レベルの物理学、化学、生物学のベンチマークでo1よりもが性能向上している
② o1
o1-preview よりも賢くて高速です。画像にも対応のマルチモーダル。ChatGPT Plus(月額20ドル)で使えます。
③ 課金プラン「ChatGPT Pro」。月額200ドル。無制限の利用とo1 pro mode が使える。
月額200ドル 日本円で約3万円 が話題ですね、、、個人だとちょっと、、、ですね
Day 2 RFT
で OpenAI の12日間連続新機能紹介の2日目はRFT Reinforcement Fine-Tuning
従来の微調整とは異なりわずか数十個の例題でもモデルの性能を向上させることができるため
専門家レベルの知識と推論能力を備えた AI アシスタントを作成することが可能になる とのこと。
RFT の仕組み は
モデルに問題を与え考える時間を与える
モデルの最終回答を採点する
正しい答えに導いた思考パターンを強化し
間違った答えに導いた思考パターンを弱める(強化学習を用いる)
RFT の活用例 としては
法務アシスタントとしての活用 たとえば契約書レビュー
希少疾患の原因遺伝子特定の補助ツールとしての活用
科学研究の膨大な論文データからの疾患情報の抽出 など
詳しくは以下の通りです
- 従来の微調整 (Fine-Tuning) との違い (Difference from Traditional Fine-Tuning):
- 従来の微調整は、モデルに入力されたテキストや画像の特徴を模倣させるように訓練させるもの。
- RFT は、モデルに新しい思考方法を学ばせ、特定の領域でより良い推論ができるようにする。
- RFT の仕組み (How RFT Works):
- モデルに問題を与え、考える時間を与える。
- モデルの最終回答を採点する。
- 正しい答えに導いた思考パターンを強化し、間違った答えに導いた思考パターンを弱める (強化学習を用いる)。
- わずか数十個の例題でも、新しい分野で効果的に推論できるようになる。
- RFT の活用例 (Examples of RFT Applications):
- 法務 (Legal): 法務アシスタントとしての活用 (e.g., 契約書レビュー)
- 医療 (Healthcare): 希少疾患の原因遺伝子特定の補助ツールとしての活用
- 科学研究 (Scientific Research): 膨大な論文データからの疾患情報の抽出
- OpenAI の RFT 研究プログラム (OpenAI’s RFT Research Program):
- 複雑なタスクに取り組む専門家チームを持つ組織を対象としたプログラム。
- 限定枠で参加可能 (詳細は動画の説明欄から)
- 公開は来年初期を予定。
ポイント
- RFT は、わずか数十個の例題でもモデルの性能を向上させることができる。
- RFT は、モデルのドメイン知識と体系的な推論能力を活用することができる。
- RFT は、医療や科学研究など幅広い分野で活用が期待される。
まとめ (Conclusion):
OpenAI の RFT は、従来の微調整とは異なり、モデルに新しい思考方法を学ばせることができる。これにより、専門家レベルの知識と推論能力を備えた AI アシスタントを作成することが可能になる。RFT は、今後様々な分野での活用が期待されており、科学研究の進歩にも貢献するだろう。
どんどん進化していますがほかのAIも凄いのでOPENAIも相当焦ってきているのかもしれないですね! 楽しみです
How Can We Help?
-
経営学用語
- AIサーバー GPUサーバー
- AI半導体AIアクセラレーター、ファウンドリー
- AI開発プラットフォーム
- GPU(画像処理半導体 Graphics processing unit)
- RAG (Retrieval Augmented Generation、検索拡張生成)
- インスタンス
- クラウドコンピューティング
- システムインテグレーター (Sler)
- シンギュラリティ (singularity)
- スケーリング則(Scaling Laws for Neural Language Models)
- ディープフェイク Deep Fake
- トランスフォーマー
- ファインチューニング
- マネージドサービス
- マルチモーダル
- 動画生成AI「Dream Machine」
- 大規模言語モデル (LLM) パラメーター数
- 生成AI
- EBITとEBITDAの違い
- NFT(Non-Fungible Token 非代替性トークン)
- SPAC スパック Special Purpose Acquisition Company 特別買収目的会社
- 「銀行業高度化等会社」とは
- 【決定版】企業価値算定DCF法CAPM ベータ値WACCとは
- オプション取引 コールオプション&プットオプション Option
- オープンAPI Open API
- キャッシュ・コンバージョン・サイクル(CCC)とは
- スワップ取引とは SwapTransaction
- テーパリング Tapering
- デリバティブとは derivative
- ハードフォークとソフトフォーク(暗号資産 仮想通貨)
- バリュー・アット・リスク Value at Risk(VaR)
- ビットコインとブロックチェーン Bitcoin&Block chain
- フィンテックベンチャー
- ブラック・ショールズ・モデル B&S Model
- リアル・オプション real option
- 一株当たり純資産とは Book-value Per Share(BPS)
- 会社のねだんの決め方~企業価値算定3つの方法 Valuation
- 会計とファイナンスの違い Accounting&Finance
- 債券とは 格付けとは
- 先渡取引とは Forward transactions
- 固定比率とは Fixed ratio
- 固定長期適合率とは fixed long term conformity rate
- 売上高営業利益率とは Operating Profit Ratio
- 売上高売上総利益率とは
- 売上高経常利益率とは ordinary profit ratio
- 当座比率とは Quick assets ratio
- 投下資本利益率(ROI)とは Return on investment
- 投資銀行(Investment Bank)&証券化
- 株主資本比率(自己資本比率)とは Capital ratio, Equity ratio
- 株価収益率(PER)とは Price Earnings Ratio
- 株価純資産倍率(PBR)とは Price Book-value Ratio
- 流動比率とは Current Ratio
- 現在価値とは何か? What is Present Value?
- 総資本回転率とは total asset turnover
- 総資産利益率(ROA)とは Return on assets
- 負債比率とは Debt Equity Ratio
- 財務諸表とは?BS PL CS
- 責任銀行原則 Principles for Responsible Banking
- 資本(自己資本)利益率(ROE)とは Return on Equity
- 配当性向とは Payout Ratio
- 金融工学とは financial engineering
- 銀行の機能とは? 金融仲介・信用創造・決済機能
- 1株当たり純利益とはEarnings per Share(EPS)
- 3つのコーポレート・ファイナンス Corporate Finance
- Alexa Rank(順位)
- DaaS Device-as-a-Subscription
- DSP SSP RBT DMP
- KGI KSF KPIの設定
- LPO Landing Page Optimization
- PASONA(パソナ)の法則 Problem Agitation Solution Narrow down Action
- RFM分析 recency, frequency, monetary analysis
- ROS/RMS分析 ROS/RMS Analysis
- SEOとSEMの違い Search Engine Optimization Search Engine Marketing
- 【まとめ】インターネット広告における主な指標 advertisement indicator
- アトリビューション分析 attribution analysis
- アドネットワーク advertising network
- アドベリフィケーション Ad-verification
- アンバサダー、アドボケイツ、インフルエンサー Ambassador Advocates Influencer
- インターナルマーケティング7つの方法 Internal Marketing
- インバウンドマーケティング inbound marketing
- エスノグラフィ(行動観察法)ethnography
- ゲリラ・マーケティング Guerrilla marketing
- ゲーミフィケーション Gamification
- コトラーの「純顧客価値」とは Net Customer Value
- コトラーの競争地位別戦略 Kotler’s Competitive Position Strategy
- コピーライティング Copywriting PREP法
- コーズ・リレイテッド・マーケティング Cause-related marketing
- サービスマーケティング service marketing
- サービス・ドミナント・ロジック Service Dominant Logic
- サービス・プロフィット・チェーン Service Profit Chain
- サービス・マーケティングの7P Service marketing7P
- ショウルーミング Webルーミング showrooming
- ソーシャルグラフ social graph
- ソーシャルリスニング・傾聴 Social Listening
- ソーシャル戦略 Social Platform Strategy
- ダイレクト・マーケティング Direct Marketing
- トリプルメディア Triple Media
- ネイティブ広告 Native advertising
- ハルシネーション ハルシネイション Hallucination
- ハワード=シェス・モデル Howard & Sheth model
- バートルテスト Bartle Test
- プログラマティック・バイイング programmatic buying
- プロダクト・プレイスメント Product Placement
- ペルソナ(persona)
- ホリスティック・マーケティング Holistic Marketing
- マズローの欲求5段階説
- マーケットシェア&マインドシェア ポジショニング戦略 positioning strategy
- マーケティングとは What is Marketing?
- マーケティングの本質とは Essence of Marketing
- マーケティングの起源 Origin of marketing
- マーケティング戦略策定プロセスの全体像 Marketing Strategy
- マーケティング戦略4P(マーケティング・ミックスMM) Product Price Place Promotion
- ラテラル・マーケティング Lateral Marketing
- リスティング広告 検索エンジン連動型広告 PPC広告 Paid Listing
- 多変量解析 multivariate statistics
- 定量分析手法多変量解析ROSRMS
- 期待不確認モデル expectation disconfirmation model
- 炎上マーケティング flaming marketing
- 経験価値マーケティング Experiential Marketing
- 行動ターゲティング広告とリターゲティング BTA behavioral targeting advertising,retargeting advertising
- 製品ライフサイクル Product life cycle
- 顧客生涯価値(ライフタイムバリュー)LTV(Life time Value)
- DAGMAR理論 DAGMAR Theory
- SERVQUAL(サーブクオル)モデル
- BPR(ビジネスプロセス・リエンジニアリング)
- DellのBTO Build To Order
- EVA Economic Value Added
- MECE(ミッシー)
- PDCA &BSC&OODA
- PEST分析 ペスト分析
- SDGsとは?
- SMART Specific、Measurable、Achievable、Related、Time-bound
- SWOT分析とクロスSWOT分析
- VRIO分析
- ★BCGのアドバンテージマトリックス Boston Consulting Group's Advantage Matrix
- ★マッキンゼーの7Sフレームワーク McKinsey 7S framework
- 「帰納法」Inductive Approachと「演繹法」Deductive Approach
- 【コア・コンピタンス】とは 模倣可能性・移転可能性・代替可能性・希少性・耐久性
- アンゾフの製品市場マトリクス(マトリックス)成長ベクトルProduct-Market Growth Matrix
- イノベーター理論とキャズム Innovation Theory & Chasm
- エフェクチュエーション(effectuation)&コーゼーション(causation)
- コーペティション経営 Co-opetition Strategy
- サンクコスト(埋没費用)バイアス
- シナリオプランニング Scenario planning
- タイムベース競争戦略 time-based competition
- デコンストラクション deconstruction
- デザイン思考 design thinking
- デジタル・フォレンジック Digital forensics
- デジュリスタンダード&デファクトスタンダード 2つの標準化(対義語) 具体例
- ネット・プロモーター経営(NPS)Net Promoter Score
- ハインリッヒの法則 Heinrich's law
- ピラミッドストラクチャー(構造化)
- フリー戦略
- フレームワークとは Framework
- ブルー・オーシャン戦略 Blue Ocean Strategy
- ポーターのCSV Creating Shared Value
- ポーターのバリューチェーン(価値連鎖)分析
- ポーターのファイブフォース分析 Porter five forces analysis
- ポーターの3つの基本戦略 Porter’s three generic strategies~ lower cost, differentiated focus
- ランチェスター戦略 弱者の戦略
- リバース・イノベーション Reverse Innovation
- 仮説思考 hypothesis thinking
- 全社戦略・事業戦略・機能別戦略 Corporate Strategy Business Strategy Functional Strategy
- 新商品や新サービスを作り出す15の発想法
- 暗黙知と形式知(SECIモデル)
- 破壊的イノベーション Disruptive innovation
- 魚は頭から腐る
- 3C分析(Customer, Competitor,Company )