初めまして、サイバーセキュリティ研究室の石川です。私は先進計算機システム研究室のメンバーではありませんが、つい先日、私が学会に提出した論文の共著として穐山先生にご指導いただいた縁で、今回記事を寄稿させていただくこととなりました。

本記事では論文の初稿を早い段階で完成させるとどのようなメリットがあるのか、初稿はいつまでに終わらせたらいいのかについて説明します。なお、本記事は国内学会や卒業論文を対象としています。

1. 論文の体裁を整えられる

日本語の文法がおかしかったり、主語がなかったり、表タイトルが下にあったりなど最低限論文の体裁を保つために必要な項目は多いです。これらの項目を見つける方法は「自動で検索・修正する」「何度も読み直して修正する」の2パターンしかありません。前者はこの記事で紹介してはいるものの、適用範囲は限られているので、基本的には何度も読み直す必要があります。つまり、これだけで非常に時間のかかる作業です。

文法が間違っている例

文法が間違っている例

誤字の例

誤字の例

2. 章構成を変えられる

多くの論文では章構成を変えられるというより、変えるべき(変えなければならない)ケースが多いです。私が他の人の論文をレビューしている時も、ほぼ100%「同じ内容が別の場所で散らばっている」「別の内容が同じ章に入っている」「後方参照が多い」といった問題が見つかります。これらは意外と書いている自分は気づきません。実際、先日書いた私の論文も初稿と最終稿ではもう別の論文じゃないかというほど構成を変えました。

章構成を変えると、それに伴って多くの文章を書き換える必要が出てきます。特に、順番を変えたことにより未定義語が発生するケースや、参照がおかしくなっているケースが多いです。これも、論文を全部読まないと気づけません。

図はMethodology章の後ろにImplementation章を追加した例です。元はMethodology章の中に一節として書かれていた内容を、Implementation章に移動させました。

章構成を変える例

3. 評価方法が十分であったかを再検討できる / 再実験できる

評価が十分でないとは、ここでは「評価手法が適切ではない」と「評価対象が網羅できていない」の2つを考えます。評価手法が適切ではない状態とは、例えば以下のケースが考えられます。

  • 自分の提案手法の有用性を示すために、自分の提案手法に有利なテストケースを用意または作成して、他の手法と比較した
  • 実験対象者の選定が適切でない
    • 例えば、「あなたはSNSが好きですか?」というアンケートをSNS上で募集しているなど
  • 現実では発生しないようなパラメータ・設定で実験している
    • 例えば、物体が落ちた時の耐久性をシミュレーションで評価する際に、空気抵抗を無視しているなど

評価対象が網羅できていない状態とは、例えば以下のケースが考えられます。

  • 物体認識の機械学習モデルを評価するために、スクランブル交差点のライブ映像を使用した
    • 人間・車以外については?

これらの問題も、意外と論文としてまとめたときに第三者が気づくもので、自分では気づかないことが多いです。しかし、気づいてしまった時の影響は大きく、その多くは再実験が必要となります。場合によっては、実験対象者を再度募集したり、実験環境を再構築したりする必要があります(実験対象者を再度募集するとき、以前実験に参加した人以外で募集しなければならないこともあります)。

私が先日書いた論文では、穐山先生に以下のような指摘をいただきました(若干ぼかしています)。

  • 機能Aはこのような実装ではなく、こういった実装をしたほうが良さそうではないですか?
    • その場合、実行時間の評価を再度行う必要があります。
  • 評価に用いたデータセットは、データセットの偏りを考慮してデータの種別ごとの評価も行なってほしいです。どういったデータは検知精度が高く、どういったデータは検知精度が低いのかを明らかにしてほしいです。
  • テストケースBは本提案手法では検知できるのか明確になっていません。

4. 先行研究を再調査できる

私たちが論文を書いている間にも、世界中の研究者はあなたの研究に似た論文を書き、発表しています。 つまり、自分の提案手法が他の論文に近しいものだったり、新しい論文で使用されている評価手法の方が適切だったり、評価での比較対象として新しい論文とも比較すべきだったりする可能性があります。 特に、評価については「3. 」でも説明している通り、再実験が必要となることがあるため、修正に時間がかかります。 評価に関わらない内容であっても、先行・関連研究に必要な論文が触れられていないと「この著者はちゃんと先行研究を調べていないのかな」と読者に思われる可能性があります。

これの対策としては定期的にGoogle Scholarのアラート機能がおすすめです。事前に設定した単語を含む論文が公開されたときにメールで通知してくれます。

5. 自分が論文で主張する範囲が正しいかを確認できる

課題の解決方法を模索していく最中、解決するには範囲(制約)を設けなければならないことがあります。 例えば、「3以上の自然数 n について、x^n + y^n = z^n となる自然数の組 (x, y, z) は存在しない」を主張する論文で、n = 4 の時だけ証明できるとします。 この場合、主張する範囲が「n = 4 の時」となります。 当然、この範囲に関する記述は論文に必須ですが、研究内容が複雑になるにつれ、自分が論文で主張したい範囲と実際に示したことが一致しないことがあります。 そこで、もし論文で主張したい範囲に特定の条件が少しでも欠けていれば、目的や議論、結論などを変更することによって対応します。

関連:「松尾ぐみの論文の書き方 - 失点を少なく、守りの野球を

6. 実装すべきだったFuture Work (FW)を実装できる

FWは、論文締め切りまでに間に合わなかったことを書いて言い訳する欄ではありません。今回はスコープ外であったが、その分野の研究を発展させるためのNext Step(展望)を書きたい欄です。そのため、自分の主張に足りていない内容がFWに書かれているような状況であれば、それを実装できます。

先日私が書いた論文では、特定の攻撃を検知する手法を提案していますが、初稿の評価指標に既存のPositiveなデータセット(攻撃データ)のみを用いていました。その理由としては、Negative(非攻撃データ)で適切なデータを集めることが難しかったからです。しかし、これでは予測を全てTrueとすれば検知率が100%になるため、議論に「Recallが高くなるように設計した」、FWに「False Positiveについては今後検証する」と記載していました。そこで、穐山先生のアドバイスのもと、False Positiveがどれくらいか正確に検証できなくとも、少なくともどういったケースでFalse Positiveが発生するのかを明らかにする方針にしました。

理想のスケジュール

「先生に初稿を見せるタイミングが論文提出の1ヶ月前」です。1週間前ではなく1ヶ月前です。卒論修論で1~2週間前に見てもらい、徹夜でギリギリまで修正するケースが多く見かけますが、これ大半は修正しきってなく、「締め切りだからこの辺りで…..」となるケースが多いです。

ならいつまでに何を終わらせればいいのか、あくまで参考としてスケジュールを以下に提案します。ここで、締切日は1/31とします。Google Calendarなどに登録しておくと良いです。

項目 締め切り 備考
実装 11/20 実装は遅れがちなので、早め早めにやっておきたいです。
評価 12/1 どうせもう1,2回やることになります。ここでは後で「この評価方法は正しいのか」を検討するために実施する評価の締め切りです。
初稿書き始め・TeX環境構築 12/1 書き始めると「この分野の参考文献も調べよう」「ここの実装変えよう」とかたくさん出てくるので、成果が出る前に書き始めた方がいいです。
初稿完成 12/31 ここだけはマストです。
先生レビュー依頼→修正 1/14 先生は忙しい場合が多いので、想像の一週間早めにレビューをお願いしましょう。
先生レビュー依頼→修正2 1/21 先生のレビュー結果の修正は、基本的に再修正することが多いです。また、先生方は読むたびにチェックする視点が変わることが多いため、一度の修正では直りきりません。
先生レビュー依頼→修正3 1/28 ここでは主に体裁を整えるだけで、大きな変更はこれ以前に終わらせておきます。しかし、人によっては先生レビュー依頼がこの後何回も必要となる場合があります。
論文脱稿 1/31 本当は3日前に終わってほしいけど、余裕を持たせている。余った時間は発表資料作成などに使う。

まとめ

本記事では実際の論文の例を交えながら、論文の初稿を早い段階で完成させることのメリットについて説明しました。また、理想のスケジュールも提案しました。論文作成のどの工程も想像以上に時間がかかるため、早め早めに進めることが大切です。

最後に、私が先日書いた論文の初稿から最終稿へのコミット差分を提示します。大変でした。 初稿からの変更差分