NotebookLMの集計が合わない。なんでやー PDFのせい?

目次
NotebookLMで社内データを読み込ませて回答させる
生成AIの中ではNotebookLMがお気に入りです。多くの中小企業では仕事を行う上で、インターネットの情報だけで完結することは少ないでしょう。社内のデータを読み込んでその内容を元に仕事をすることになるでしょう。
そのため手持ちの資料を読み込んで、その内容に質問・回答してくれるNotbeookLMの可能性は高いと言えます。
ただね。。やはり間違いはあります。手持ちのデータからだけ回答するので幻覚を見るケースは減っている気がします。どこの文章を参照したか、という参照元を確認できますしね。
一方で、集計とか計算をすると間違いがちです。
サンプルデータを作って実験
以下のように名簿を作りました。150人の職員がいて、勤続年数や、基準日時点の年齢、資格のありなしが記載されています。


このエクエルをPDFにしてNotebookLMに読み込んでみました。
職員数は集計して正解
150名をカウントしてくれました。

平均勤続数を計算してもらいましたが、数値があわない
続いて、職員の平均勤続年数を計算してもらいました。エクセルであらかじめ平均を計算すると19.8年です。
しかし結果は、20.8年と数値があわず。合計は3122年ということで、エクセルで計算すると2977年でした。足し算の段階で間違っていますね

資格の有無を集計してもらいました
変な集計の仕方ですが、集計して78人と教えてくれました。実際は資格ありは80人でした。おしい。

PDFだと回答品質が下がるのかと思ってマークダウン形式にしてみる
エクセルをClaudeでmdファイルにしてもらいました。


mdファイルもNotebookLMに取り込めます。
ちゃんと80名と回答してくれた。PDFよりmdの方が、精度出るかしら。

その後色々質問しましたが、mdファイルでの方が精度はよかったですが、計算が発生するものはmdでもまちがうことはありました。なかなかまだ悩ましいところです。
そんなところで。