データ入力作業は入力原票をデジタルデータ化することである。その入力原票は紙媒体であるが、最近では画像化された入力原票の取扱いも増えてきている。
あらかじめ入力原票をスキャナーで読み込み、画像として媒体に記録する工程(イメージ化)が必要である。そのイメージ化した入力原票をもとにデータ入力しデジタル化する。
暗号化伝送による情報漏えい、紛失事故の解消、分割入力による個人情報保護などに加えて、入力原票の保管場所やデリバリ経費の削減など安全面・経費面に効果がある。
一方、スキャナー、サーバー、回線機器、専用ソフトなどの経費が発生するし、イメージデータによるデータ入力の生産性も紙媒体によるデータ入力と比べて低い。これは紙媒体の場合はオペレータが最終項目を入力している間に次のデータを確認し、入力項目を先読みしているからである。片方、イメージデータは、最終項目の入力が終わらないと次のデータ(画面)に切り替わらないために先読みができない。この時間差が生産性を低下させている要因である。
しかしながら、近年イメージデータが増大してきており、入力ソフト等も改良されてきているので、イメージデータと紙媒体の入力料金に差を付ける意義が薄れてきている。
よって、イメージデータの入力料金は、スキャニング等の入力以外の工程を除き、4-2によるものとした。
データ入力は、オペレータが入力原票上の文字を読み取り、文字キーやファンクションキーをタッチ入力していくというすべてが人手による作業である。
そのため、入力原票の内容、例えば入力原票の大きさ、フィールド(入力項目)の配置、記入された文字の状態などにより作業の生産性や統一性の判断が難しくなるため、以下の点を考慮してデータ入力料金を見積るものとする。
入力原票の記載内容、入力の要件により難易度を評価する。記載内容とは文字の判読、認識のし易さであり、入力の要件とはオペレータの生産値である。
楷書で濃い文字であることが望ましい。不特定多数の者による手書の文字は、癖がありオペレータが判読するのに苦労する。
オペレータが一目で瞬時に認識できる文字数は数字で6桁以下である。例えばコード番号のように、長い数字の羅列はオペレータの認識の限界を超えており途中で位置や桁数を確認する作業が発生するため、事前に6桁ずつの目印を入れるなどの作業が必要となる場合がある。
入力箇所が飛び飛びで、絶えず位置確認が必要なものは生産性及び品質精度に問題が生じる。
アンケートのように1桁の単独フィールドが多いとタッチのリズムが取り難く見かけより生産性が落ちる要因となる。
オペレータの作業テーブルの上に乗らないものや小さいものは、扱いにくく効率を阻害する。また、入力原票1枚のタッチ数が極端に少ないものは、紙めくり時間が多くを占めるためにその時間を見積もる必要がある。
複写用紙の場合、2枚目以降になると記入文字のかすれや欄ずれがあるため、1枚目を入力原票とすることが望まれる。
データ入力料金は、入力文字数に文字単価を乗じて求めることが原則であるが、前述したように原票判読の難易度やデータ入力量によっては、下記の式により入力原票1件(レコード)当りの単価を算定する場合がある。
なお、この料金には一次入力及び検査入力(ベリファイ入力)の料金も含まれる。

データ入力作業は、データ量の多少にかかわらず「2.2 作業のプロセス」で述べた各工程を経て完成品を納品するので、入力料金以外にも一定の作業コストが必要となる。
入力料金の単価を算出するには、入力作業以外の作業コストの比重が高くなり大きな影響を受けることになる。(例えば、入力料金が1件10円とした場合、その他の工程のコストが10,000円として、1件しか発生しない場合は10,010円となるが、1,000件の場合は総額20,000円で1件当たり20円となる。)
したがって、発生件数が定まっている場合及び発生毎に安定した数量であれば単価の算定は容易であるが、変動が大きい場合は、過大又は過小見積の原因となる。
よって、少量データの見積りにおいては、作業効率等を考慮した一定の数量を基本数量と定め、これに必要とするコストを付加した額を基本料金とする。基本数量を超過したものについては、別途入力料金の単価を定めて課金する。
この方法により、過大、過小見積・請求を防ぐことができる。
基本料金=(デリバリ料金・チェッカ料金・アウトプット料金等)+(基本数量に対応する入力料金)
当協会で定めるデータの入力作業は、データ入力専用のソフトウェアを使って一次入力、検査入力という二度の作業を行う。そして、4−2の(1)データ入力の難易度における[1]から[6]の条件をデータが満たしていると仮定した場合、当協会員の実績の平均値として、下記に各データの精度を表示した。
日本語データの文字精度は、99.95%以上。
入力文字数10,000文字に対して、誤入力が5文字未満をいう
(ミス率0.05%未満)
ANKデータの件数精度は、99.999%以上。
ANKデータ100,000件に対して、誤入力件数が1件未満をいう
(ミス率0.001%未満)