OCR精度設計
「推測で埋めない」設計思想。6スキルが連携し、安全最優先で数量を出力します。
最上位安全原則(絶対優先)
⛔造成土量は断面根拠と高低差根拠が弱いなら確定してはならない
⛔外構基礎体積は詳細根拠が弱いなら確定してはならない
⛔OCRが怪しいときは賢く埋めず、候補比較・警告・未確定分離を優先する
⛔完全性より安全性、出力量より監査性を優先する
① 事故防止
›② 根拠保持
›③ 未確定分離
›④ 数量出力
AI 6スキルパイプライン
01
画像前処理 & OCR解析
ocr_parse_skill傾き補正・ノイズ除去・コントラスト最適化・余白トリミング後、OCRエンジンでテキスト抽出。数値・寸法・レベル・表候補を分離。
parsed_text_blocksnumeric_candidateslevel_candidateslow_confidence_candidates
🛡
信頼度閾値未満の数値は「候補」として保持。確定しない。
02
レイアウト構造解析
layout_structure_skill断面図・表領域・基準高記号(GL/FH/EL)を検出。平面図と断面図のリンク関係を確認。
table_regionssection_drawing_detectedelevation_data
🛡
断面図が検出されない場合、土量確定を禁止。
03
建設専門用語解釈
term_interpret_skill造成・外構・一般土木辞書で用語を正規化。同義語統合・数量対象化・unknown_terms抽出。
interpreted_termsquantity_targetssynonym_resolution_logunknown_terms
🛡
辞書照合なしに専門用語を解釈しない。一般語で補完しない。
04
土工数量計算
earthwork_calc_skill切土・盛土・残土・埋戻し・法面の数量を平均断面法で計算。断面と高低差の根拠を保持。
earthwork_itemscalc_processmethod_comparisonunresolved_earthwork_points
🛡
断面なし・高低差不明・GL/FH/EL競合の場合は数量確定禁止。
05
外構・構造物数量拾い
structure_quantity_skill擁壁・側溝・U字溝・集水桝・舗装・フェンス・ブロックの延長・面積・体積・個数を拾い出す。
structure_itemsstructure_calc_processunresolved_structure_points
🛡
基礎体積は詳細図がなければ確定禁止。
06
数量バリデーション
validation_skill単位整合・根拠整合・OCRリスク・重複計上・基準高矛盾・confidence算定。問題項目はunresolved_itemsへ。
validated_earthworkvalidated_structureswarningserrorsconfidence_summary
🛡
目的は「通すこと」ではなく「止めること」。事故防止最優先。
重点誤読監視パターン
ocr_parse_skillが以下の誤読パターンを重点監視し、候補比較・confidence低下を行います。
| パターン | 説明 |
|---|---|
| GL/GI/G1 | 基準高の誤読 (GL↔GI↔G1) |
| FH/EL/FL | 計画高の誤読 (FH↔EL↔FL) |
| 0/O/D | 数字ゼロとアルファベット混同 |
| 1/I/l/7 | 1・I・l・7 の混同 |
| 8/3 | 8と3の混同 |
| 300/30O/3OO | 300の誤読バリエーション |
| +1.250/+7.250 | 高さ数値の誤読 (1↔7) |
信頼度 3段階表示
確定≥85%
信頼度 85%以上。そのまま見積に反映可能。
要確認65〜84%
信頼度 65〜84%。レビューキューへ。目視確認を推奨。
危険<65%
信頼度 65%未満。手動修正必須。見積確定前に必ず確認。
強制停止条件一覧
造成土量の停止条件
- ✗断面図が存在しない
- ✗現況高と計画高の差分根拠なし
- ✗GL/FH/EL/計画高の解釈競合
- ✗高低差の符号が確定できない
- ✗断面間距離または適用範囲不明
- ✗OCR起因で高さ数値に競合
外構基礎体積の停止条件
- ✗詳細図が存在しない
- ✗基礎幅が不明
- ✗基礎深さが不明
- ✗基礎断面形状が不明
- ✗延長との対応関係が不明
- ✗OCR起因で基礎寸法に競合