-
Notifications
You must be signed in to change notification settings - Fork 37
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
New biomol fields #400
base: develop
Are you sure you want to change the base?
New biomol fields #400
Changes from 10 commits
eca24df
572a29f
173172f
5911d53
05a8fed
76f690c
1f5650d
a8781ac
ac6ed65
55f71e2
534ec8d
f865a5a
af3c817
616019c
bd3e9e1
ce93c9d
a875aaf
a1ddd88
a0ee16a
c0ea1ac
af14d72
7610146
c38075c
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
Original file line number | Diff line number | Diff line change | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
@@ -2127,6 +2127,7 @@ species | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`nattached`: list of integers (OPTIONAL) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`mass`: list of floats (OPTIONAL) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`original_name`: string (OPTIONAL). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`_biomol_atom_name`: string (OPTIONAL). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Requirements/Conventions**: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
@@ -2165,6 +2166,8 @@ species | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
**Note**: With regards to "source database", we refer to the immediate source being queried via the OPTIMADE API implementation. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
The main use of this field is for source databases that use species names, containing characters that are not allowed (see description of the list property `species_at_sites`_). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **\_biomol\_atom\_name**: OPTIONAL. Name of the atom according to the biomolecular field standards. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- For systems that have only species formed by a single chemical symbol, and that have at most one species per chemical symbol, SHOULD use the chemical symbol as species name (e.g., :val:`"Ti"` for titanium, :val:`"O"` for oxygen, etc.) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
However, note that this is OPTIONAL, and client implementations MUST NOT assume that the key corresponds to a chemical symbol, nor assume that if the species name is a valid chemical symbol, that it represents a species with that chemical symbol. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
@@ -2465,6 +2468,150 @@ Relationships with calculations MAY be used to indicate provenance where a struc | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Appendices | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
========== | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Domain Specific Fields | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---------------------- | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
The fields below are all optional and are only used within specific research fields. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Every field has a standard domain-specific prefix. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
_biomol_chains | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
~~~~~~~~~~~~~~ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Description**: For each chain in the system there is a dictionary that describes this chain. Chains are groups of related residues (e.g. a polymer). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Databases are allowed to add more properties as long as the properties are prefixed with the database specific prefix. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Type**: list of dictionaries with the properties: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`name`: string (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`residues`: list of integers (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`types`: list of strings | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`sequences`: list of strings | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`sequence_types`: list of strings | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Requirements/Conventions**: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Query**: Support for queries on this property is OPTIONAL. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
If supported, only a subset of the filter features MAY be supported. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **name**: The chain name/letter. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **residues**: A list of integers referring to the index of :field:`biomol_residues`, that belong to this chain. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
The list SHOULD NOT be empty. The index of the first residue is 0. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **types**: A list of tags/labels specifying the type of molecules this chain contains (e.g. 'protein'). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
This field is useful as an overview of every chain and as a query target for the structure. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Standard labels for this field are the follwoing: 'protein', 'nucleic acid', 'carbohydrates', 'lipid', 'membrane', 'ligand', 'ion', 'solvent' and 'other'. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
The list SHOULD contain values within the standard labels. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Additional custom labels MAY be used. These labels MUST include the database-provider-specific prefix with the following format: <prefix>:<label>. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **sequences**: A list of residue sequences in current chain. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. If the same sequence occurs twice in a chain. Should the sequence be listed here twice or just once? |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **sequence_types**: A list of tags specifying the type of each sequence in the :property:`sequences` field. The type of a sequence is defined by its components (e.g. 'aminoacids'). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- There SHOULD NOT be two or more chains with the same :property:`name`. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- Values in :property:`name` SHOULD be in capital letters. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- Values in :property:`name` SHOULD NOT be longer than 1 character when the number of chains is not greater than the number of letters in English alphabet (26). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- Values in :property:`sequences` SHOULD be in capital letters. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- Number of values in :property:`sequences` and :property:`sequence_types` MUST match. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Maybe add here that the order of the values should also be the same.
Suggested change
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Examples**: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
.. code:: jsonc | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"biomol_chains":[ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"name": "A", | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"residues":[0,1,2,3, ...], | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"types": ['protein', 'ions'], | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"sequences": ['MSHHWGYG'], | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"sequence_types": ['aminoacids'] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"name": "B", | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"residues":[54,55,56,57, ...], | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"types": ['nucleic acid'], | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"sequences": ['GATTACA'], | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"sequence_types": ['nucleotides'] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
} | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
_biomol_residues | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
~~~~~~~~~~~~~~~~ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Description**: For each residue in the system there is a dictionary that describes this residue. Residues are groups of related atoms (e.g. an aminoacid). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Databases are allowed to add more properties as long as the properties are prefixed with the database specific prefix. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Type**: list of dictionaries with the properties: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`name`: string (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`number`: integer (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`insertion_code`: string or null (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
d-beltran marked this conversation as resolved.
Show resolved
Hide resolved
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`sites`: list of integers (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Requirements/Conventions**: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Query**: Support for queries on this property is OPTIONAL. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
If supported, only a subset of the filter features MAY be supported. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **name**: The residue name | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **number**: The residue number according to source notation. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **insertion_code**: The residue insertion code. It MUST NOT be longer than 1 character. It MAY be null. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **sites**: A list of integers referring to the index of :field:`cartesian_site_positions`, that belong to this residue. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
The list SHOULD NOT be empty. The index of the first site is 0. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- There MUST NOT be two or more residues with the same integer in :property:`sites`. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
d-beltran marked this conversation as resolved.
Show resolved
Hide resolved
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- All :property:`name` and :property:`insertion_code` values SHOULD be in capital letters. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Examples**: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
.. code:: jsonc | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"biomol_residues":[ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"name": "PHE", | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"number": 17, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"insertion_code": null, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"sites":[0,1,2,3, ...] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"name": "ASP", | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"number": 18, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"insertion_code": null, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"sites":[17,18,19,20, ...] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"name": "LEU", | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"number": 18, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"insertion_code": "A", | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"sites":[29,30,31, ...] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more.
Suggested change
For me the indentation levels were not consistent so I try to correct them here. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
} | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
_biomol_sequences | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
~~~~~~~~~~~~~~~~~ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Description**: A list of residue sequences in current structure. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Every sequence is a dictionary which includes the sequence itself and the type of sequence it is. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Every sequence may include a list of chain and residue indices. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sequences may be grouped and ordered in any form (e.g. by chains, by fragments of covalently bonded atoms, etc.) as long as they make sense when querying structures by sequence. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Type**: list of dictionaries with the properties: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`sequence`: string (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`type`: string (REQUIRED) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- :property:`chains`: list of integers | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Requirements/Conventions**: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Query**: Queries on this property SHOULD be supported. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **sequence**: A string with a letter for each residue in the sequence. Letters SHOULD be capital letters. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **type**: The type of a sequence is defined by its components (e.g. 'aminoacids'). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **chains**: A list of integers referring to indices in :field:`biomol_chains` for chains which include this sequence totally or partially. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
There MUST NOT be repeated indices in :property:`chains`. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
- **Examples**: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
.. code:: jsonc | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
"biomol_sequences":[ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
sequence: 'MSHHWGYG', | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
type: 'aminoacids' | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
{ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
sequence: 'GATTACA', | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
type: 'nucleotides' | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Would it not be better to use something other than "nucleotides" so we can destinguish between DNA and RNA? |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
} | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
} | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
The Filter Language EBNF Grammar | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-------------------------------- | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
I think it would be good to add a custom label to the example.