2007年04月27日 学会誌
大阪大学蛋白質研究所 PDBj 中村春木
蛋白質や核酸等の生体高分子の立体構造データベースは、従来からwwPDB (world-wide Protein Data Bank:国際蛋白質構造データバンク http://www.wwpdb.org/) が、その登録とインターネットを通じた配布を行っ ております。日本では、大阪大学蛋白質研究所が、PDBj (Protein Data Bank Japan:日本蛋白質構造データバンク http://www.pdbj.org/)という組織を作り、米国のRCSB-PDBおよび欧州のMSD-EBIと協力して、この事業を行っており ます。
ところで、最近の実験手法の進展、蛋白質機能についての知見の増大、 PDBデータ処理法の進化により、PDBデータにはいくつかの不具合が生じ始めて います。wwPDBでは、この数年、これらのデータを修正し、より統一性のとれ たデータベースとする作業を行ってきました。その成果として、PDBの座標デ ータファイルのフォーマットとデータそのものを修正し、2007年4月からテスト的な公開を始めました。PDBjにおいては、
http://www.pdbj.org/remediation/index_j.html(日本語ページ)および
http://www.pdbj.org/remediation/(英語ページ)にて公開をしております。
このテストデータに対する皆様からのコメントやご指摘を受けてさらにマイナーな修正を行い、2007年7月1日から本格的な運用を開始する予定です。ただ し、従来の形式のデータも、Time stamped dataとして引き続き維持してまいります。
下記が主な修正点です。
・ 原子名称:下記に示すように、IUPAC(国際純正・応用化学連合)命名法に 従った化学構造辞書
(Chemical Component Dictionary, http://remediation.wwpdb.org/downloads.html) に合致するよう標準化を行いました。これにより、特に水素原子の名称が大幅に変更になりました。また、核酸のリボースやデオキシリボースの原子名についていた*が ’に変更されています。
・ 配列データベースと生物種の分類情報をアプデートし、化学構造と配列情 報の間の不一致を修正しました。
・ 主たる文献情報を検証し、修正いたしました。
・ ウィルス構造において、その座標系、対称性、座標系の変換について、登録された実験情報を修正いたしました。
・ デオキシリボヌクレオチドは DA, DC, DG, DT, DIと表記し、リボヌクレオチドはこれまでどおりA, C, G, T, Iと表記するようにいたしました。
・ ビームラインとシンクロトロンの装置名称を、
BioSync (Structure Biology Synchrotron Users Organization: http://biosync.sdsc.edu)
が定義するものに合致させました。
・ 化学構造辞書 (Chemical Component Dictionary) を作成し、ポリペプチドや核酸、糖などの高分子だけでなく、それ以外の低分子やモノマー・リガンドの化学構造の記述も標準化して記述しました。具体的には次のように作成されています。
* 標準のアミノ酸や核酸に対して、C末原子のOXTあるいはHXTの例外を除いて、IUPAC命名法に従った原子名称とすることにいたしました。
* 化学構造辞書には、リガンドの標準モデルとしての座標を表示しました。
* 化学物質のよく利用される記述法(SMILESやInChI)を用いました。
* 光学活性の記述を加えました。
* 同一のリガンドに対する重複した名称による記述を削除しました。
* 化学物質の記述法として、アミノ酸のN末やC末および側鎖におけるイオン化の状態に応じた多様な状態に対応できる記述法を追加しました。
今回の修正のより詳細については、上記Web pageを参照いただくか、直接,新しい修正データをダウンロード・ページからダウンロードしてご確認ください。
また、ご質問やご要望があります場合には、http://www.pdbj.org/second/pdbj_contact_j.html のページから、メールをご送付し、PDBjスタッフにご連絡ください。
皆様のご協力をお願いいたします。