労働災害データベースCSVデータの公開について
職場のあんぜんサイト(厚生労働省)で「死亡災害データベース」「労働災害(死傷)データベース」として公開されているExcelデータを、BOM無しUTF-8のテキストファイル(CSV形式)にまとめました。データの整合性についても可能な限り修正しています。修正箇所および修正方法については、以下をご覧ください。
【整形対象データ】
職場のあんぜんサイト
・労働災害(死亡・休業4日以上)データベース
平成18年~平成29年 144ファイル,データ総数 376,397件
・死亡災害データベース
平成3年~平成30年 28ファイル.データ総数44,537件
【CSVファイルの仕様】
・ヘッダの有無:あり
・区切り文字:カンマ
・項目:ダブルクォーテーション囲み
・文字コード:UTF-8(BOM無し)
・死亡災害
No. | 項目名 | 補足 |
---|---|---|
1 | ID | 元ファイルのID |
2 | 西暦 | 新規追加 |
3 | 年号 | 新規追加 |
4 | 年 | 新規追加 |
5 | 月 | |
6 | 発生時間 | 別添コード表で統一 |
7 | 災害状況 | |
8 | 業種(大分類)コード | 別添コード表で統一 |
9 | 業種(大分類)分類名 | 別添コード表で統一 |
10 | 業種(中分類)コード | 別添コード表で統一 |
11 | 業種(中分類)分類名 | 別添コード表で統一 |
12 | 業種(小分類)コード | 別添コード表で統一 |
13 | 業種(小分類)分類名 | 別添コード表で統一 |
14 | 事業場規模 | 別添コード表で統一 |
15 | 起因物(大分類)コード | 別添コード表で統一 |
16 | 起因物(大分類)分類名 | 別添コード表で統一 |
17 | 起因物(中分類)コード | 別添コード表で統一 |
18 | 起因物(中分類)分類名 | 別添コード表で統一 |
19 | 起因物(小分類)コード | 別添コード表で統一 |
20 | 起因物(小分類)分類名 | 別添コード表で統一 |
21 | 事故の型コード | 別添コード表で統一 |
22 | 事故の型分類名 | 別添コード表で統一 |
・死傷災害
No. | 項目名 | 補足 |
---|---|---|
1 | ID | 元ファイルのID |
2 | 西暦 | 新規追加 |
3 | 年号 | |
4 | 年 | |
5 | 月 | |
6 | 発生時間 | 別添コード表で統一 |
7 | 災害状況 | |
8 | 業種(大分類)コード | 別添コード表で統一 |
9 | 業種(大分類)分類名 | 別添コード表で統一 |
10 | 業種(中分類)コード | 別添コード表で統一 |
11 | 業種(中分類)分類名 | 別添コード表で統一 |
12 | 業種(小分類)コード | 別添コード表で統一 |
13 | 業種(小分類)分類名 | 別添コード表で統一 |
14 | 事業場規模 | 別添コード表で統一 |
15 | 起因物(大分類)コード | 別添コード表で統一 |
16 | 起因物(大分類)分類名 | 別添コード表で統一 |
17 | 起因物(中分類)コード | 別添コード表で統一 |
18 | 起因物(中分類)分類名 | 別添コード表で統一 |
19 | 起因物(小分類)コード | 別添コード表で統一 |
20 | 起因物(小分類)分類名 | 別添コード表で統一 |
21 | 事故の型コード | 別添コード表で統一 |
22 | 事故の型分類名 | 別添コード表で統一 |
23 | 年齢 |
・コード表は こちらからダウンロード
【修正箇所】
もとのExcelファイルに対応する形で、修正箇所一覧を「修正箇所ファイル」にまとめました。データ形式はスペース区切りのSSV(Space Separated Values)です。
【修正方法】
・一般事項
別添のコード表をマスターデータとして、死亡災害データベースおよび労働災害(死傷)データベースの全ファイルを修正しました(表記方法が統一されていなかった業種や事故の型の分類名などがすべて統一されています)。
なお、今回修正対象となったデータベースの課題は、下記文献で説明しています。
労働安全衛生誌:「機械判読の観点からみた労働災害データベースの課題」
DOI:https://doi.org/10.2486/josh.JOSH-2022-0009-CHO[J-Stage]
・業種データ
- (ア) 元ファイルにそもそもデータが記入されていない箇所は、空文字です。
- (イ) コード体系が規則から逸脱しているデータは、下記方針で修正しました。
- A) 数値の入力ミスなど、ヒューマンエラーによるコード入力誤りと思われる箇所は、正しい内容に修正。
- B) 上記A)による修正が困難なデータは、小分類を基準として大分類および中分類の値に修正。
・起因物データ
- (ア) 元ファイルにそもそもデータが記入されていない箇所は、空文字です。
- (イ) コード体系が規則から逸脱しているデータは、「災害発生状況を熟読し、適切と思われる起因物のコードと分類名に修正」しました
・災害状況
- (ア) 修正範囲は機種依存文字で記載された単位の文字列置換など、機械的に変換可能な範囲です。災害状況の内容が変わるような修正は行っていません。
- (イ) 英数字は半角英数字に統一し、位取りのカンマを削除しました。
- (ウ) 句読点を「。」「、」で統一しました。
- (エ) 文字化けおよび機種依存文字を排除しました。
- (オ) 単位はすべてカタカナによる読みに置換しました(例:km → キロメートル)。
- (カ) 冗長な空白を削除しました。
【ExcelソフトによるCSVファイル確認方法】
Windows上のExcelにてCSVファイルを閲覧するには、「データ」タブにある「データの取得」または「テキストまたはCSVから」を選択して、データをインポートしてください。CSVファイルをダブルクリックする方法では、文字化けが生じるため適切に読み込むことができません。
【ExcelソフトによるSSVファイル確認方法】
Windows上のExcelにてSSVファイルを閲覧するには、「データ」タブにある「データの取得」または「テキストまたはCSVから」を選択して、データをインポートしてください。その際、ファイルの種類は「すべてのファイル(*.*)」を選択してください。SSVファイルをダブルクリックする方法では、文字化けが生じるため適切に読み込むことができません。
平成29年修正箇所 | 平成28年修正箇所 | 平成27年修正箇所 | 平成26年修正箇所 | 平成25年修正箇所 | 平成24年修正箇所 | 平成23年修正箇所 | 平成22年修正箇所 | 平成21年修正箇所 | 平成20年修正箇所 |
平成19年修正箇所 | 平成18年修正箇所 |