統合レポート(PoC #1-5 投資先各社の状況)
契約ベース検証
業務担当者と合意した契約に対する達成度。「期待値と一致」「明示的ブロッカーで停止」「未定義」を区別します。
完成版 xlsx2 との差分は 参考 扱い。
ブロッカー内訳と解消計画
| ブロッカー | 件数 | 解消手段 | 想定工数 |
reader_unimplemented |
22 |
PDF株主名簿/試算表 reader の実装 |
各2-4時間 |
ocr |
9 |
履歴事項証明書のスキャンPDFをOCR(Tesseract等)で読み取り |
1日 |
calc_unimplemented |
3 |
評価額・按分・1株指標の計算ロジック実装(PoC #6-9) |
1-2週間 |
会社別サマリ
| 社名 |
契約 pass |
契約 blocked |
整合性ルール |
詳細 |
| 株式会社WAKUWAKU |
9 / 15 |
6 |
🟢 |
契約 |
詳細
|
| ガレージバンク株式会社 |
5 / 10 |
5 |
🟢 |
契約 |
詳細
|
| 株式会社あんしんサポート |
0 / 8 |
8 |
🟢 |
契約 |
詳細
|
| インベストデザイン株式会社 |
0 / 9 |
9 |
🟢 |
契約 |
詳細
|
| 株式会社ORENDA WORLD |
4 / 10 |
6 |
🟢 |
契約 |
詳細
|
参考: 完成版 xlsx2 との単純比較
完成版(人手作成)と自動抽出値を機械的に比較。期間・単位・粒度の違いを吸収していないため、
mismatch のほとんどはフォーマット差異です。これは精度指標ではありません。
| 社名 | match | mismatch | extraction_failed |
| 株式会社WAKUWAKU |
17 |
109 |
28 |
| ガレージバンク株式会社 |
13 |
65 |
16 |
| 株式会社あんしんサポート |
0 |
0 |
9 |
| インベストデザイン株式会社 |
0 |
2 |
7 |
| 株式会社ORENDA WORLD |
0 |
6 |
11 |
この PoC が示すこと
- 抽出ロジックは Python ルールベース: 説明可能・テスト可能・引き継ぎ可能
- 契約に対する自動達成と明示ブロックを区別: 「精度 X%」ではなく「契約 N 件中 M 件 pass、L 件は理由つきで blocked」
- 追跡可能性 100%: 各値の出所(ファイル・ページ・セル)を全て記録
- 嘘をつかない: 取れない箇所は明示的に unknown / blocked、勝手に推定しない