2026-05-31 2026-06-05

ACL論文執筆のヒント

Tips

はじめに
1. 優れた論文の要件
2. いかにして動機が明確な論文を書くか？
3. いかにして新規性のある論文を書くか？
4. いかにして検証が適切な論文を書くか？
5. いかにして「よく書けている」論文を書くか？
6. いかにして再現性のある論文を書くか？
7. よくある質問
結論
参考文献

はじめに

本記事では、NLP/ML（自然言語処理/機械学習）分野において、著者と査読者の両方を経験してきた知見から、*ACL系列（ACL, EMNLP, NAACL, EACL, AACL）の国際学会に向けた論文執筆のコツを共有します¹。 *ACLへの投稿が初めての方や、論文執筆のスキルをさらに向上させたい方の参考になれば幸いです。（なお、私自身も常に学び続けている身です。したがって、以下の内容はあくまで一研究者の経験に基づく見解として受け取っていただければと思います。）

1. 優れた論文の要件

さて、どのような論文が「優れた論文」とみなされるのでしょうか？

この問いへの答えは様々あるかと思いますが、私は以下の5つの要件が満たされている論文は、「優れた論文」とみなされると考えています。

動機（Well-motivated）：研究の動機が明確に説明されていること。「なぜこの研究が重要なのか」「どんな課題を解決するのか」という問いに、説得力のある答えが示されていること。
新規性（Novel）：これまでに探索されていない、新しいアイデア（分析も含む）や手法が提示されていること。何らかの形でNLP/MLの分野に対して新しい貢献をもたらしていること。
検証（Well-executed）：実験デザインが適切であり、結果が客観的かつ明確に提示されていること。
執筆（Well-written）：読みやすいこと。全体が論理的に構成されていること。
再現性（Reproducible）：第三者が結果を再現できるよう、十分な情報（ソースコード、データ、詳細な設定など）が提供されていること。

以下では、それぞれの要件について詳しく掘り下げていきます。

2. いかにして動機が明確な論文を書くか？

“well-motivated paper”（動機が明確な論文）を書くには、「なぜこの研究が重要なのか」「どの課題を解決しようとしているのか」という問いに、きちんと答える必要があります。

その対応策として、私は論文の Abstract と Introduction に、以下の6つの要素を必ず組み込むようにしています。

一般的な背景（General background）：研究テーマの大まかな背景を説明し、分野全体の文脈と、なぜその領域が重要なのかを示します。
主要な課題（Key challenge）：論文が取り組む、本質的な課題を明確に提示します。何が問題であり、なぜそれを解決するのが難しいのかを説明します。
既存の解決策とその限界（Current solution and its limitations）：先行研究を説明した上で、その問題点を指摘します。なぜ先行研究では不十分なのか、どのようなギャップが存在するのかを明らかにします。
提案手法（Proposed solution）：先行研究の欠点をどのように克服するのか、解決策を説明します。どのような手法で、どのような新しい貢献をもたらすのかを述べます。
有効性の検証方法（How we verify the effectiveness）：提案手法の有効性をどう検証したかを簡潔に説明します。
貢献の要約（Summary of contributions）：論文の主要な貢献を箇条書きでまとめ、分野に対して具体的に何を提供したのかを明確にします。

では、私のACL採択論文である『Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Source-Shielded Updates』のIntroductionを実例として、上記6つの要素がどのように組み込まれているかを見ていきます。

① 一般的な背景

Large language models (LLMs) demonstrate remarkable generalization across numerous applications (OpenAI, 2025; Guo et al., 2025; Yang et al., 2025; Gemma Team et al., 2025). However, they notoriously underperform in languages absent or underrepresented in their training data, creating a barrier to equitable access for speakers worldwide (Huang et al., 2023). The standard approach to resolve this issue is continual pre-training (CPT) or fine-tuning on target language data (Cui et al., 2024; Ji et al., 2025).

この段落では、まず「低資源言語におけるLLMの性能低下」という、本研究が扱う全体的なテーマを導入します。その後、現在の標準的なアプローチ（対象言語での継続事前学習やファインチューニング）を提示し、次の段落でその問題点を指摘するための「土台」を築いています。

② 主要な課題

Yet, adapting instruct models to these languages is uniquely challenging. Such models require specialized instruction-tuning data (Wei et al., 2022; Rafailov et al., 2023), which is often unavailable or prohibitively costly to create for underrepresented languages (Huang et al., 2024c). Furthermore, machine-translated data as a low-cost alternative is not consistently effective (Tao et al., 2024).

ここで重要なのは、研究の焦点を特定のモデルタイプ（指示学習モデル; instruct models）にあえて限定している点です。その上で、「指示学習データの不足」という本質的な課題を提示しています。また、低コストな代替案である「機械翻訳データ」の限界にも触れることで、課題の難しさをさらに強調しています。

このように、論文の焦点を「指示学習モデルの対象言語適応」に絞り込み、他の関連する問題（ベースモデルの適応など）をあえて研究の対象外にすることで、研究の範囲が明確になり、動機がより明確になります。

③ 既存の解決策とその限界

Consequently, using unlabeled target language text is often the only viable option for adaptation. While this approach can improve target language proficiency, it often triggers catastrophic forgetting (Kirkpatrick et al., 2017; Tejaswi et al., 2024; Mundra et al., 2024; Yamaguchi et al., 2025), where new training erases prior knowledge. This issue is acute for instruct models, as it cripples the general-purpose functionality of the model, which is primarily derived from core abilities like chat and instruction-following. In response, previous work has attempted post-hoc mitigation. For example Yamaguchi et al. (2025) merge weights of the original and adapted models, while Huang et al. (2024c) use a task vector and apply parameter changes from CPT on the base model to the instruct model. Nonetheless, these methods largely fail to mitigate catastrophic forgetting, substantially degrading these core functionalities.

The shortcomings of post-hoc methods suggest that mitigation should occur during adaptation. We therefore focus on the CPT stage. Specifically, we leverage selective parameter updates, a method of restricting which weights are modified during training. This approach is proven more effective at mitigating catastrophic forgetting than alternatives like parameter-efficient fine-tuning, regularization, or model merging (Zhang et al., 2024a; Hui et al., 2025). However, existing selective parameter tuning paradigms for adapting LLMs are ill-suited for adapting instruct models with unlabeled target language text. They rely either on random selection, offering no principled way to preserve knowledge, or on signals from the new data to guide update (target-focused) (§2). Target-focused signals are particularly vulnerable because raw text lacks chat templates required to elicit instruction-following behavior. Optimizing for this incompatible format risks corrupting the very foundational capabilities we aim to preserve due to the structural differences between raw text and chat templates.

ここでは、まず「教師なしテキストの利用」という現実的な解決策を提示しつつ、それが「破滅的忘却」を引き起こすという限界を述べています。さらに、この問題に対して「事後的な対策（モデルマージなど）」を試みた先行研究を紹介し、それらも破滅的忘却を十分に緩和できていない（＝核心的な機能が低下する）という限界を説明しています。

事後的な方法の限界を示した後は、「対策は学習の段階で行うべきだ」という自説を展開します。そこでCPT段階における「選択的パラメータ更新」が有望なアプローチであることを説明しつつ、しかし「既存の選択的パラメータ更新」もまた、本質的な解決にはなっていないことを指摘します。既存手法はランダムな選択か、対象データに焦点を当てた学習に依存しているため、本研究の文脈では効果的ではないと説明しています。これが、次のブロックで提案する手法の伏線になります。

💡 執筆のヒント：このブロックは1つの段落で構成されることもあります。上記の例では、読みやすさを考慮して2つの段落に分割しています。第一段落で「既存の解決策の限界」、第二段落で「既存の選択的パラメータ更新手法の限界」に焦点を当てることで、構造を整理しています。

④ 提案手法

We therefore introduce Source-Shielded Updates (SSU), a novel source-focused approach that proactively shields source knowledge before adaptation begins (Figure 1). First, SSU identifies parameters critical to source abilities using a small set of source data and a parameter importance scoring method, such as those used in model pruning, e.g., Wanda (Sun et al., 2024). Second, it uses these element-wise scores to construct a column-wise freezing mask. This structural design is crucial. Unlike naive element-wise freezing that corrupts feature transformations, our column-wise approach preserves them entirely. Finally, this mask is applied during CPT on unlabeled target language data, keeping the shielded structural units frozen. This process allows SSU to effectively preserve the general-purpose ability of the model while improving target language performance.

このブロックでは提案手法の概要を記述します。既存手法の限界（Target-focusedなど）をどのように克服しているかを明確にしつつ、手法の具体的なメカニズム（データの選定、マスクの作成、構造の保存など）を簡単に説明します。通常、この部分には手法を視覚的に説明する図を入れることが多いです。図を入れることで、査読者・読者の直感的な理解を助けることができます。

⑤ 有効性の検証方法

We verify our approach through extensive experiments with five typologically diverse languages and two different model scales (7B and 13B). We evaluate source language (English) performance across dimensions including chat, instruction-following, safety, and general generation and classification, alongside target language performance.

提案手法をどのように評価したかをコンパクトに述べます。一部の論文ではここに主要な結果（Key findings）を紹介することもありますが、私個人としては、文章の冗長さを避けるためにここでは実験概要に留め、詳細な結果の紹介は「Results」セクションに譲るスタイルが好みです。

⑥ 貢献の要約

We summarize our contributions as follows:

A novel method for adapting instruct models to a target language without specialized target instruction-tuning data, addressing a key bottleneck to expand linguistic accessibility.

At two model scales, SSU consistently outperforms all baselines on all core instruction-following and safety tasks. It achieves leading target-language proficiency rivaling full fine-tuning while almost perfectly preserving general source-language performance.

Extensive analysis validates the efficacy of SSU, confirming the superiority of column-wise freezing and the importance of source data-driven parameter scoring. Qualitatively, we show that SSU avoids the linguistic code-mixing that state-of-the-art methods suffer from, explaining its superior abilities across source chat and instruction-following tasks.

最後に論文の主要な貢献を要約しておきます。いろいろな書き方がありますが、「1つ目は手法/リソースの提案」「2つ目は主要な実験結果」「3つ目は詳細な分析・考察」という構成が目安です。

3. いかにして新規性のある論文を書くか？

新規性は論文採択において極めて重要な要素です。しかし同時に、「何をもって新規性とするか」は査読者の主観に左右されやすく、意見が分かれやすい部分でもあります。

私個人としては、これまで探索されていなかった新しいアイデアや手法が提示されていれば、それは十分に新規性があるとみなせると思います。必ずしも画期的な手法が必要なわけではありません。例えば、既存手法の新しい応用、新しいデータセットの構築、あるいはこれまでにない深い分析も新規性のある貢献とみなされるはずです。

つまり、他の要件（明確な動機: well-motivated、適切な検証: well-executed、洗練された執筆: well-written、再現性: reproducible）がすべて高いレベルで満たされているのであれば、論文執筆時に過度に「新規性」を意識しすぎる必要はないと思います。

4. いかにして検証が適切な論文を書くか？

最新のモデルを使用する
古いモデルを使用した実験は、論文全体を時代遅れに見せ、査読者の評価を大きく下げる原因になります。研究の価値や実用的な意義を示すためには、論文執筆時点で分野の主流となっている最新モデルを使うことが極めて重要です。「先行研究がモデルAを使っていたから」「公平な比較のため」という理由は、変化の激しい現在のNLP/ML分野においては、かなり弱い言い訳になります。もし過去の手法と実験条件を揃えたい場合は、古いモデルでの結果も残しつつ、必ず最新モデルを用いた実験も追加して研究の妥当性を示すと好印象です。
複数のモデルファミリーおよびスケールで評価する
残念ながら、LLMはモデルが変わると挙動が一変することがよくあります。同じモデルファミリーであっても、モデルの大きさ（7B、13Bなど）が変わるだけで挙動が真逆になることすら珍しくありません。したがって、得られた知見の頑健性・堅牢性を証明するには、複数の異なるモデルファミリーやスケールでの検証が不可欠です。

査読をしていると「計算資源に限りがあるため」という著者の反論をよく見かけますが、これはあまり有効な主張にはなりません。もし計算資源が限られているなら、せめて「最も性能の良い自前のアプローチ」と「トップのベースライン」だけに絞ってでも、複数のモデルやスケールで比較して一般性を示すべきです。
強力かつ最新のベースライン用意する
提案手法の有効性を証明するには、現在最も強力とされる最新のベースラインと比較すべきです。弱かったり、古かったりするベースラインとの比較ばかりだと、論文としてのプロフェッショナルさに欠けると判断され、査読者の印象を悪くします。仮に事情があって弱いベースラインを混ぜる必要がある場合は、なぜそれを選んだのかを明確に説明する必要があります。
実験デザインのベストプラクティスに従う
結果の信頼性と妥当性を担保するために、分野の標準的な評価ベンチマークと評価指標を使用するのがおすすめです。テキスト生成タスクなど、結果に変数の影響が出やすい実験では、複数の異なる乱数シードで実験を走らせ、その平均値を報告するのがベストです。
包括的なアブレーション分析を行う
提案手法が複数のコンポーネントやハイパーパラメータで構成されている場合、どの要素がどれだけ全体の性能向上に寄与しているかを分解して調べるアブレーション分析が必須です。各要素の役割を深く理解することは、手法の説得力を高める上で欠かせません。

5. いかにして「よく書けている」論文を書くか？

論文執筆のテクニックは無数にありますが、本記事では特に*ACL系列の学会に向けた論文を書く上で重要となる「ルール（暗黙の了解）に従うこと」「明確さ（Clarity）」「簡潔さ（Conciseness）」の3点に絞って解説します。

ルール（暗黙の了解）に従うこと

質問: なぜ執筆の（暗黙の）ルールに従う必要があるのですか？

回答:

論文の見た目が良くなるため。
典型的な「フォーマット」が存在するのは、それが最も理解しやすいとコミュニティに受け入れられているからです。言い換えれば、「フォーマット」からの逸脱は査読者の認知負荷を高め、それだけで論文を読みにくくさせてしまいます。
査読者が独自の執筆スタイルに気を取られることなく、研究の内容そのものに集中できるようになるため。

学会のフォーマットガイドラインを厳格に守る
当たり前のことに思えるかもしれませんが、学会のフォーマットガイドラインを遵守することは極めて重要です。正しいテンプレート、フォントサイズ、行間を使用してください。ガイドラインに従わないと、論文が不作法に見えるだけでなく、最悪の場合はデスクリジェクトに繋がる可能性すらあります。特に、ML系の分野から*ACL系列に初めて投稿する人がやりがちなミスとして、「表のキャプションを上に配置してしまう」というものがあります。*ACLの論文では、図も表も、キャプションはすべて下に配置します。また、ページ制限に収めるためにスペース微調整コマンド（\vspace や \hspace など）を多用して無理やりスペースを調整するのも、論文の見た目が悪くなり、査読者の印象を悪くする可能性があるため避けるべきです²。
典型的な研究論文の構成に従う
一般的な研究論文は、以下の王道の構成を持っています：Abstract, Introduction, Related Work, Methodology, Experimental Setup, Results, Analysis, Conclusion, Limitations, and Ethical Considerations。この構成に従うことで、論文が整理され、格段に読みやすくなります。もちろん、論文の具体的なテーマによって多少の差異はありますが、基本的にはこの構成に従うのが望ましいです。

さらに、各セクションの内部についても、それぞれの「典型的な構造」に従うことが重要です。例えば、Introductionセクションであれば、先述の「いかにして動機が明確な論文を書くか？」のセクションで説明した構造に従うべきです。
Abstract と Introduction で宣言したことを、以降のセクションで確実に実行する
序論で大風呂敷を広げたにもかかわらず、後半の章でそれに一切触れていない論文を見かけることがあります。これは論文の信頼性を致命的に損ない、査読者から低い評価をもらう原因になります。
関連研究（Related Work）では、関連研究との「違いや関係性」を簡潔かつ明確に説明する
関連する論文をただリストのように並べるだけで、自分たちの研究がそれらの関連研究とどう違うのか、あるいはどう関係しているのかを説明していない論文はNGです。これをしておかないと、査読者や読者が論文の新規性や重要性を理解するのが難しくなってしまいます。
提案手法（Methodology）は、段階的に積み上げる（Build-up）ように説明する
提案手法を説明する章は、段階的に積み上げるような形で整理されるべきです。まず手法の全体像の提示から始め、その後に各コンポーネントや手順の詳細な説明へと進みます。さらに、提案手法に複数の派生形がある場合は、まず最も基本となるバージョンを説明し、その後に個別のサブセクションや名前付きパラグラフ（太字の段落）を使って、それぞれの派生形の動機を短く添えながら説明していくのがおすすめです。これにより、提案手法の章全体が整理され、より理解しやすくなります。
実験設定（Experimental Setup）を詳細に書く
時折、実験設定の章が非常に曖昧だったり、極端に短かったりする論文を見かけますが、私の意見としてはこれは大きな間違いです。この章は、多くの意味で極めて重要な役割を持っています。
- Resultsセクションのレイアウトを規定する
  例えば、実験設定の章で「提案手法の有効性を、(i) 指示追従とチャット性能, (ii) 安全性性能, (iii) ソース言語性能, (iv) ターゲット言語性能で検証する」と記述した場合、Resultsセクションでも全く同じ対応関係を持つサブセクションや名前付きパラグラフを配置すべきです。これにより、Resultsセクションが整理され、読みやすくなります。
- 論文に含まれる実験を正当化するのに役立つ
  このセクションは、単に実験の詳細を紹介するだけでなく、「なぜその実験設定が、提案手法の有効性を検証する上で適切なのか」を正当化する場でもあります。例えば、なぜ特定のタスク、特定の言語、特定のモデルスケールなどを選んで評価したのか、その理由をここで説明できます。これをしておくことで、論文の説得力が増し、査読者から飛んでくるかもしれない批判を先回りして防ぐことができます。
Resultsセクションを書き始める前に、ハイライトしたい要素の箇条書きリストを作る
結果の章を執筆する前に、この章で強調したい主要な側面の箇条書きリストを作っておくと非常に役立ちます。具体的には、「モデル別の結果、タスク別の結果、言語別の結果、モデルスケール別の結果…」といった感じです。もし論文の中に特定の「リサーチクエスチョン（Research Questions; RQs）」を設けているのであれば、このリストは「RQ1に対する結果、RQ2に対する結果…」のようになります。
各分析（Analysisセクション）の冒頭で、短い動機を述べる
読者は、関連研究や提案手法のセクションなどで説明した、手法やフレームワークに関する詳細をすべて覚えているわけではありません。そのため、いきなり「Table Xは〜を示している; “Table X shows that …“」「Figure Yは〜; “Figure Y shows that …“」と書き始めるのではなく、それぞれの分析で「一体何を調査しようとしているのか（目的）」を、本題に入る前に短く一言述べることが重要です。

明確さ（Clarity）

シンプルで明確な言葉を使う
*ACLの査読者や読者の大半は、英語のネイティブスピーカーではありません。そのため、論文を読みやすく、理解しやすくするためには、シンプルで明確な言語を使用することが非常に重要です。
専門用語（Jargon）の乱用や、複雑な文を避ける
専門用語や複雑な文章は、論文を読みにくく、理解しづらくさせます。査読者が投稿論文の特定テーマにはあまり詳しくないものの、より広いNLP/ML分野のエキスパートである場合、論文が専門用語や複雑な文で埋め尽くされていると、理解するのに大変苦労することになります。したがって、専門用語や複雑な文章は可能な限り避けてください。特に Abstract、Introduction、Conclusion セクションでは徹底すべきです。
略語（Abbreviation）は初出時に必ず定義する。また、多用しすぎない
私個人の意見として、論文の中で略語を大量に生み出しすぎることも避けるべきだと考えています。論文が読みにくくなる原因になるからです。人間の作業記憶には限界があります。読者にとって、多すぎる略語をすべて把握し続けるのは非常に困難です。
重要な詳細を付録に丸投げしない
付録は、追加の実験詳細や、先行研究の補足、あるいは補足的な結果のためにのみ使用されるべきです。最も重要な点として、査読者は付録を読む義務はありません。そのため、もし重要な詳細を付録に載せることを決めた場合、査読者がそれを読んでくれることを期待してはならず、これがネガティブなレビューに繋がる可能性があることを認識しておくべきです。

簡潔さ（Conciseness）

簡潔に、要点を絞って書く（だらだらと長い段落は書かない）
ダラダラと長い段落を書くのはやめましょう。一般的な読者は、長い段落を読むほどの忍耐力を持ち合わせていません。もし自身が査読者の立場だとして、文字で埋め尽くされた長い段落を読みたいと思うでしょうか。多くの人は避けたいはずです。したがって、論文執筆時は、簡潔に、要点を絞ることが重要です。もし伝えたいことがたくさんあるのなら、それを複数段落に分割するようにしてください。各段落は、明確な1つの主旨だけを持ち、長くなりすぎないようにすべきです。
長い一文を書かない
文についても全く同じことが言えます。長い一文を書くのはやめましょう。もし一文が長くなってしまったら、複数の短い文に分解するようにしてください。もし一文の中に、接続詞（”and”, “but”, “or” など）と関係節（”which”, “that” など）が同時にいくつも現れているなら、それは文が長すぎるサインであり、より短い文に分割すべきだという証拠です。長文は、論文を読みにくく、理解しづらいものにする原因の一つです。

6. いかにして再現性のある論文を書くか？

Apptainer や Docker などの再現可能なツールを実験に導入する
NVIDIA、AMD、vLLM、PyTorchなどは、LLM実験に最適化された構築済みのDockerイメージを提供しています。これらを利用することで、実験の再現性が担保され、他の人が容易に実行できるようになります。また、他の研究者が論文の結果を再現しようとする際に、いわゆる「依存関係の地獄（Dependency hell）」に陥るのを防ぐことにも繋がります。
ソフトウェアとハードウェアのバージョンを論文内に明記する
コンテナを使う場合であっても、主要なライブラリやハードウェアのバージョンを論文に記述することは重要です。これにより、他者が「どのような環境で実験が行われたのか」を理解しやすくなり、再現時に発生するかもしれない潜在的な問題を特定する手がかりになります。例えば、PyTorchを使用して論文内で引用する際は、\citep[vX.X.X]{pytorch} （vX.X.X は実験で使用した具体的なバージョン）のように明記すると良いでしょう。
ハイパーパラメータの対照表を掲載する
実験を行った場合は、学習率、バッチサイズ、プロンプトのテンプレートなど、主要な設定値を網羅したハイパーパラメータの表を、本論または付録に必ず含めてください。
コードリポジトリの README ファイルを徹底的に作り込む
他者が論文の結果を確実に再現できるようにするためには、詳細なREADMEファイルが極めて重要です。READMEには、環境の構築手順、コードの実行方法、そして実験結果の評価スクリプトの動かし方を手順ごとに説明する必要があります。
論文に含まれる「すべての実験」のコードを公開する
時折、提案手法のコードだけを公開し、論文内で比較したベースラインの実験コードを載せていないリポジトリを見かけます。これではベースラインのコードにアクセスできないため、他者が同じ条件で結果を再現することが困難になります。ベースラインのコードを含めない明確な理由がない限りは、それらもすべてリポジトリに同梱し、READMEファイルに実行方法を記載すべきです。これが論文の再現性を高め、論文そのものの信頼性を大きく向上させることになります。
コード内でのパス指定には、相対パスか環境変数を使用する
コード内に絶対パスをハードコードするのは絶対にやめてください。環境が変わると動作しなくなるため、他者が結果を再現する際の大きな妨げになります。必ず相対パスか環境変数を使用してください。
バージョン管理には Git を使い、外部コードの依存関係には Git Submodules を活用する
コードの変更履歴を追跡し、他者と共同研究を行う上で、Gitによるバージョン管理は非常に役立ちます。また、比較対象のベースラインなど、外部リポジトリのコードに依存している場合は、Gitサブモジュールを使用して管理してください。これにより、他者がリポジトリとそのサブモジュールをまとめて簡単にクローンできるようになるため、結果の再現が格段にスムーズになります。
論文内に、匿名化されたコードリポジトリへのリンクを掲載する
査読用に匿名化されたリポジトリへのリンクを論文内にしっかりと含めることが重要です。コードへの導線が用意されていることは、論文の再現性を証明するだけでなく、査読者に対する論文の信頼性を高める上でも有効です。

7. よくある質問

論文の執筆はいつ始めるべきですか？
できる限り早く書き始めることをおすすめします。一発で完璧な論文を書くことはほぼ不可能です。執筆を早く始めることで、時間をかけて何度も推敲し、改善することができます。
言いたいことが山ほどあるのに、ページ制限が短すぎます。どうすればいいですか？
多くの場合、「書きたい」と思っていることの大部分は、論文の「メインメッセージ」にとっては重要ではないことが多いです。一本の論文は、一つの主要なメッセージや課題に集中しているべきであり、論文内のすべてのコンテンツはそのメッセージに直接貢献するものである必要があります。核心に直結しない内容は容赦なく削るか、付録に回してください。
これまでに行ったすべての実験結果を論文に載せるべきですか？
いいえ。論文のメインメッセージを証明するために真に不可欠で、関連性のある実験だけを選別して掲載してください。
なぜ私の論文はリジェクトされ続けるのでしょうか？心が折れそうです。
リジェクトは、多くの研究者にとって日常茶飯事であり、ごくありふれた経験です。どうか落ち込まないでください。（私の失敗談を集めた『CV of Failures』も参考にしてください）。大切なのは、査読者がくれたフィードバックから真摯に学び、論文を継続的に改善し続けることです。また、学会に投稿する前に、同僚や指導教員に見てもらい、事前にフィードバックを得ることも非常に有効な手段です。

結論

*ACL系列の国際学会に向けた論文の執筆は、決して簡単なことではありませんが、それと同時にやりがいのあるプロセスです。本記事で紹介したヒントやガイドラインに従うことで、みなさんの論文が査読者や読者に高く評価され、採択を勝ち取るための一助となることを願っています。

最後に最も重要なアドバイスとして、「私たちは『他者』に研究を伝えるために論文を書いている」 ということを忘れないでください。「自分（筆者）が理解できているから、読者も当然理解できるだろう」と思い込んで書くのは、失敗のもとです。査読者や読者は執筆者の心を読むことはできないので、すべては明確かつ明示的に記述される必要があります。

そしてもう一つ、「自分が査読者や読者の立場だったときに、読みたくないような文章は絶対に書かない」 という視点を持つのをおすすめします。他人の書いた文字だらけの長いパラグラフを読みたくないのなら、自分自身も長いパラグラフを書いてはいけません。執筆中は、常に査読者や読者の立場に身を置いて、自分の文章を客観的に見つめ直してみてください。

参考文献

私の初めての主著論文がACL系学会に採択されたのは、2021年のEACLでした。また、2023年より継続的に*ACL系列の国際学会で査読者を務めています。 ↩
スペースがどうしても足りない場合は、生成AIを活用して、意味を変えずに冗長な単語や文を徹底的に削り、より簡潔な表現に書き直すことをおすすめします。 ↩