Japanese
  • NLP2025, day 4

    Mar 13, 2025 日記 学会

    言語処理学会年次大会4日目。まだ明日もあるけどそろそろお疲れモード。オンライン参加なので籠もっている&ご飯普通に食べておやつも食べてるのだけど体重と体脂肪率は下降傾向に。これはあれですね、やつれてる。 今日は対話、LLM構築、招待講演に参加。うちの学生(船迫さん)も質問コメントどしどし貰えてて良かった! D8: 対話(1) D9: 対話(2) C10: LLM構築 D8-1: 話者特性に基づくターンテイキング速度の分析 話者間の役割/関係性/個人特性の違いが、ターンが取られるタイミング(というより速度か)に影響しているのではという検証結果。因果関係は不明だけど、そういう風に認知されやすいというのはあるのかな。 D8-2: 性格特性に …

    続きを読む
  • NLP2025, day 3

    Mar 12, 2025 日記 学会

    学会3日目はずっとAセッション(A5〜A7, NLPモデルの解釈可能性・分析)に参加してました。 A5 A6 A7 A5-1: 層の冗長性と層同士の独立性に基づく言語モデルの層交換の成否の特徴づけ モデルマージしやすい条件を明確にしたい。層を線形変換で近似することで冗長性と独立性を計測して検証したという話。 A5-2: 束縛変項照応を用いた大規模言語モデルのプロービング 複数要因が絡む状況下でそれを判別する質問項目追加することで被験者をカテゴライズするという考え方自体はあちこちで役立ちそう。 A5-3: Tracing the Roots of Facts in Multilingual Language Models: …

    続きを読む
  • NLP2025, day 2

    Mar 11, 2025 日記 学会

    学会オンライン参加2日目。今日はNLPモデルの評価・安全性・信頼性なセッション(A1, A2)と心理言語学・認知モデリング(B3, B4)、招待講演に参加してきました。以下面白かった発表メモ。 A1-3: 有害性評価と巻き戻しによる LLM の有害コンテンツ生成回避 有害コンテンツ回避を目的とした事例が増えてきているけども多くは学習コストなり推論コストが高くて辛いよねということから、なるべく「軽量かつ効果的」な方針をとりたいというのが狙い。そこでチェックタイミングを「モデルの息継ぎ(単語出力時の確率が低い状態≒次にどの単語を出力しようか迷っている状態)」を基準としてチェックするようにすることで軽量にしたとのこと。 A1-6: 手動設 …

    続きを読む
  • NLP2025, day 1

    Mar 10, 2025 日記 学会

    NLP2025が始まりました。今回は自腹なので旅費ケチるためと、会場参加それなりに大変(*1)だということを去年思い知ったので、今年はオンライン参加することに。 (*1) ほぼ会場は椅子だけ。ノートPCを膝上で開きつつ Slack やらあれこれする。その割に充電コーナーはかなり少ない。 初日はチュートリアルのみです。 T1: 言語モデルの内部機序:解析と解釈 スライド 関連事例紹介ベースに掘り下げつつ体系化した紹介がメインではあったけども、「面白いよね」で終わらず、このアプローチ自体への疑義も示してくれてました。例えば、、 そもそも概念や機能がモデル内部のどこか(内部表現や計算機構)に局所的に埋め込まれているという前提は妥当なのか? …

    続きを読む
  • 卒論、修論、ミニワークショップ終了, 2025

    Feb 21, 2025 日記 NAL研

    学士の最終発表が先週(2/10)、修士の最終発表が昨日(2/20)終了しました。研究室恒例の卒業生&修了生主体でやって貰ってる「新配属生向けミニワークショップ」も終了ということで、基本的なタスクはほぼほぼ終わりですね。正確にはまだ残ってるタスク(主に成果物整理)は残ってたりしますが、それは追々やって貰うということで。 参考 2024年度 2022年度 2019年度 2025年度のネタはこんな感じでした。 セッション1 研究の息抜き 振り返ってみるとこうしたら良かった 卒業研究について 研究で役に立つTips 君も大学院生にならないか🖐️2 ターミナルでタスク管理しよう Taskwarrior 入門(残念ながらスキップ) セッション2 …

    続きを読む
  • DeepSeek-R1論文読んだ印象

    Feb 3, 2025 日記 研究

    微妙に時系列悩んだけど DeepSeek LLM => R1-Zero => R1 という流れなのかな。最初に公式ページから見つけたリポジトリが DeepSeek LLM の方で、そっちの論文は古かったんだよな。以下は DeepSeek-R1 についての雑感メモ。 ステップ 目的 手法 結果 Step 1: 事前学習 言語知識を獲得 大規模コーパスで学習 言語理解は可能だが推論能力は未熟 Step 2: Cold Start SFT 回答フォーマットと可読性の向上 高品質な少量データでSFT RLの初期学習がスムーズに進む Step 3: GRPO 推論能力を強化 強化学習(RL)+ 報酬関数 数学・論理推論・コーディン …

    続きを読む
  • 追い込み時期

    Jan 10, 2025 日記 NAL研議事録

    年明け一発目のゼミが終了しました。毎年恒例行事で多くの卒論・修論生は追い込み時期ということもあって予定時間超過することが多くなる時期でもあります。インフルエンザが猛威を振るってることや冷え込む時期ということもあって体調不良で休んでいる人もいましたが、それでも予定時間をかなりオーバー。他の人の話聞かなくていいじゃんとか思ってる人いるかもしれないけど、メタ的には似たような指摘をしていることが多くて、ゼミやる意義でもあるのだよな。(似た失敗してるということは私自身の指導が毎回偏っていることの証左でもあるのだろうけど) 文脈を気にせず「誰それがこれやってるからやってみた」というやり方はダメ。 いろいろやっているのは分かるが「論文として整理し …

    続きを読む
  • 実質使い放題

    Dec 24, 2024 日記 実験

    幸いなことに知能情報コースにはTesla V100S付きのサーバが4台あるお陰で、実質的にGPU使い放題です。1台で LLM 8B ぐらいまでは辛うじて full パラメータ学習でき、13Bでも LoRA なら学習できるぐらいの環境。DeepSpeedとかで分散処理するともう少し大きなモデルまで学習できるかもしれませんが、そこは試していません。 この時期(12月)は卒論修論追い込みでもあるのでジョブ貯まりまくりかなと思ってたけれどもたまに覗く限りではスカスカ。たまに 1 job 動いてるのを見かけるぐらい。研究室の環境で十分ということかもしれないし、Google Colabの無料分で十分とか、ほんのり課金で事足りてるかもしれないし、 …

    続きを読む
  • 共通教育「情報科学演習」〜OneDriveのことは考えたくない〜

    Dec 3, 2024 日記 教育

    せっかくなので琉球大学(知能情報)アドベントカレンダー Advent Calendar 20243日目の記事だ! 授業「情報科学演習」 2022年から共通教育の授業「情報科学演習」を1クラス担当することになりました。とはいえシラバス眺めてみると「クラス毎に大分中身が違う」のだよな。大別すると以下の3点にまとめられそうだけど、殆どの授業は前者2つがメインかもしれません。 情報リテラシー Office系ソフトの演習 データサイエンス系の演習 これに対して高校では2022年4月から新しい学習指導要領が始まっているので、2025年度からは情報Iを履修した生徒が入ってきます。指導要領の解説から抜粋すると以下のようなことを掲げているらしい。 今 …

    続きを読む
  • 授業「プログラミング1」の変遷

    Dec 2, 2024 日記 教育

    琉球大学(知能情報)アドベントカレンダー Advent Calendar 2024が空いてるので2日目の記事です!! 授業「プログラミング1」の変遷 私がプログラミング1を担当し始めたのが2016年。このタイミングでPythonにしました。基本情報処理技術者試験では2020年度からPython追加されてるので、数年前からやってたことになりますね。とはいえ2023年の試験からは疑似言語に統一されているんだよな。 英語教科書指定は大分不満があっただろうなと想像します。でもこの教科書はそれなりに平易な英語で書かれてて、コース会議でも回覧して承認してもらったし、プログラミング系公式ドキュメントは殆ど英語で書かれてることを考えると最初から英語 …

    続きを読む
    • ««
    • «
    • 1
    • 2
    • 3
    • 4
    • 5
    • »
    • »»

tnal

Technologist, perpetual student, teacher, continual incremental improvement.
続きを読む

Recent Posts

  • MLP & Transformer演習用シミュレータ
  • (イベント記録)Jagu'e'r 沖縄分科会:データで考える、沖縄の「ちょうどいい」と「もっといい」
  • 入学イベントが過ぎて授業開始
  • Claude code(Sonnet 4)雑感6:コンテキストクリアを恐れない方が良い
  • データマイニング班:最終発表会
  • Claude code(Sonnet 4)雑感5:仕様駆動開発で4万行越え
  • Claude code(Sonnet 4)雑感4:環境依存度が高いと混乱しがち?
  • Claude code(Sonnet 4)雑感3:仕様駆動開発

Tags

日記 1781 NAL研議事録 286 イベントレポート 260 講義/実験 202 教育 138 お食事 119 休日 116 学会 89 データマイニング班 80 プログラミング1 75 研究 74 複雑研 60 E13 58 デザインスクール 50
All Tags
E1358 E261 NAL研3 NAL研議事録286 イベント2 イベントレポート260 イベント告知22 データマイニング(授業)1 データマイニング班80 お食事119 クイズ40 コラム記事35 ススメ41 デザインスクール50 プログラミング20 プログラミング175 プログラミング219 学会89 環境構築30 休日116 教育138 健康23 研究74 講義/実験202 実験1 授業6 進化計算班議事録15 体調メモ31 日記1781 複雑研60 本1 本家サイト更新履歴22 妄想8
[A~Z][0~9]

Copyright © 2026 NAL’S BLOG @ 琉球大学工学部知能情報コース. All Rights Reserved