tsv2xlsx
各参加組織様で便利なツールなりマクロなりをすでに使っていらっしゃると思いますが...
JAIRO CloudからエクスポートしてきたZIPファイルまたはTSVファイルを読み込んで、編集用のExcelファイルを作ります。
- セルの書式設定は基本的に「文字列」にセットされます。
- 5行目に「フィルター」が設定されます。
送信するファイルを選択
「選択するファイルを選択」の下のボタンをクリックすると、ファイル選択用のウインドウ(Windowsの場合はエクスプローラー)が開きます。次のいずれかの形式のファイルを指定してください。
-
JAIRO CloudからエクスポートしてきたZIPファイル。
または、「Administration」→「アイテム管理」→「インポート」でアイテム一括登録に使える形式のZIPファイル。
ZIPフィアルを展開すると、その直下に「data」ディレクトリがあり、その「data」ディレクトリの中にTSVファイルがあるタイプのZIPファイルです。
-
上記の形式のZIPファイルを展開した結果から取り出したTSVファイル。
オプションの説明
ごちゃごちゃいろいろなオプションがありますが、基本的にデフォルトのままで大丈夫です。
Excelのデフォルトの列幅は「8.38」(らしい)ですが、それを変更します。整数を指定してください。
ここで値を指定しても、「値が入っていない列の列幅」が指定されていたら、該当列はその幅になります。
さらに、「言語属性を持つ列幅を狭くする」にチェックが入っていたらそれが最優先されます。
TSVファイル中、6行目以降に値がまったく入っていない列の幅を指定します。「0」(=列を非表示)にすることもできますが、「0」を設定することはお勧めしません。
ここでどの値を指定しても、次の「言語属性を持つ列幅を狭くする」をチェックした場合はそちら(=言語に関係する列は幅3)が優先されます。
デフォルトの「標準列幅」の時:

列幅として「2」を指定した時:

2行目(メタデータ項目名の内部キー)のセルの値が、「language」または「lang」で終わる時は、標準の列幅に関わらず列幅を3にセットします。
列幅3だと3行目(メタデータ項目名のラベル)が全部表示されません。2行目(メタデータ項目名の内部キー)に薄い緑色を付いているので「緑色だったら言語」と判断してください。
なお、.subitem_language (言語[].言語)だけは3文字の言語コードを使うことになっています。
この列だけは他の2文字コードを使う列より幅を微妙に広くしています(そして色もちょっと濃い)。
TSVファイルに書かれたアイテムデータ行の下に、書式・数式を設定した空白の行を「追加行数」で指定した分だけ追加します。
ピンク色の行が表示されます。「ピンク色の行より下の行には、書式・数式は何も設定されていませんよ」の印です。
オプションを指定しない時:
オプションを指定した時:
3行目(メタデータ項目名ラベル)に、簡単なヘルプをExcelの「メモ」(←昔は「コメント」と呼ばれていました)として設定します。
セルに設定されるメモヘルプよりも、もう少し詳しいヘルプをウェブブラウザで表示します。
現在はJPCOARスキーマガイドラインへのリンクですが、一部のページは当サイト独自のページにジャンプするものが出るかもしれません。
以下のフィールド(基本的にスキーマガイドラインで「統制語彙」が設定されているもの)に、Excelの「データの入力規則」を設定します。
残念ながら.resourcetype (資源タイプ.資源タイプ)にはデータの入力規則が設定されません。Excelのリスト形式の入力規則は、選択肢の文字列数に制限があるのですが、.resourcetypeは選択肢が多すぎてその文字数を超えてしまうからです。
複数のアイテムのデータを入力しているとします。
特定のアイテムをその他のアイテムと区別するのに一番役立つのは#.idでもページ番号でも著者名でもなくやはり論題(タイトル)だと思うのです。
このオプションをオンにすると、
- .metadata.ほげほげ.subitem_titleを見つけて、その列をA列に移動させます。
- オプションを指定しない時は6行目で「ウインドウ枠の固定」がされますが、このオプションを指定するとB6セルでウインドウ枠を固定します。(つまり、最左列のタイトルは必ず画面に表示された状態になります)
- .metadata.ほげほげ.subitem_titleが複数あるアイテムタイプの対応はまだです。
「紀要の最新号の内容を登録するときに、一つ前の号の内容を参考にする」「過去に登録したのと性格が似た論文を登録する」ときに使います。
エクスポートしてきたデータに対して次の処理をします。
- 既存のアイテムを間違って上書きしてしまうことだけは避けないといけません。
#.id (#ID)を削除します。
加えて、次の列の値も削除します。
.uri (URI), .pos_index[*] (.POS_INDEX[*]), .cnri (.CNRI), .doi_ra (.DOI_RA), .doi (.DOI), .edit_mode (Keep/Upgrade Version), *.url, *.filesize[*].value
-
4行目に「System」が入っている列の値を削除します。
-
.file_path[*]に含まれるディレクトリ名(「recid_xxxx/」)を取り除きます。
元のTSVファイルに「recid_12345/JOP-70-1.pdf」と書かれていたら、Excelファイルには「JOP-70-1.pdf」のみが残ります。
条件付き書式
次の条件付き書式が設定されます。
- 2行目(メタデータ項目名の内部キー)に重複した値を持つ列があると、それらのセルの背景色が赤色になります。
トップページ