reciprocal_smallest_distance

Screenshot Software:
reciprocal_smallest_distance
Mga detalye ng Software:
Bersyon: 1.1.5
I-upload ang petsa: 20 Feb 15
Lisensya: Libre
Katanyagan: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance ay isang pairwise orthology algorithm na ginagamit ng pandaigdigang pag-align ng pagkakasunod-sunod at maximum posibilidad sa gitna ng ebolusyon distansya sa pagitan ng mga pagkakasunud-sunod upang tumpak na nakita ng orthologs sa pagitan ng genomes.
Pag-install Mula sa isang Tarball
I-download at untar ang pinakabagong bersyon mula sa github:
cd ~
kulutin -L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar xvz
I-install ang reciprocal_smallest_distance, siguraduhin na gamitin ang Python 2.7:
cd reciprocal_smallest_distance-VERSION
python setup.py-install
Ang paggamit ng RSD sa Hanapin Othologs
Ang sumusunod na halimbawa ay nagpapakita ng mga command sa pangunahing mga paraan upang mapatakbo rsd_search. Ang bawat pananalangin ng rsd_search nangangailangan ng pagtukoy ng lokasyon ng isang FASTA-format ang pagkakasunud-sunod ng file para sa dalawang genomes, na tinatawag na query at napapailalim genomes. Ang kanilang mga pagkakasunod-sunod ay di-makatwirang, ngunit kung gagamitin mo ang pagpipilian --ids, ang mga id ay dapat manggagaling sa query Genome. Dapat mo ring tukuyin ang isang file upang isulat ang mga resulta ng orthologs matagpuan sa pamamagitan ng RSD algorithm. Ang format ng output file ay naglalaman ng isa ortholog bawat linya. Ang bawat linya ay naglalaman ng pagkakasunud-sunod id query, nakabatay pagkakasunud-sunod id, at distansya (kinakalkula sa pamamagitan ng codeml) sa pagitan ng mga pagkakasunud-sunod. Maaari mong opsyonal na tukuyin ang isang file na naglalaman ng mga id gamit ang pagpipilian --ids. Pagkatapos ay rsd lamang maghanap ng mga orthologs para sa mga id. Paggamit ng --divergence at --evalue, mayroon kang pagpipilian ng paggamit ng iba't ibang mga threshold mula sa mga default.
Humingi ng tulong kung paano patakbuhin ang rsd_search, rsd_blast, o rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Hanapin orthologs pagitan ng lahat ng mga pagkakasunud-sunod sa query at napapailalim genomes, gamit ang default na pagkakaiba-iba at evalue mga hangganan
mga halimbawa rsd_search -q / genomes / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genome = halimbawa / genomes / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Hanapin orthologs gamit ang iba't non-default pagkakalayo at evalue mga hangganan
mga halimbawa rsd_search -q / genomes / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genome = halimbawa / genomes / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0.5 0.00001 --de 0.8 0.1
Ito ay hindi kinakailangan upang i-format ang isang FASTA file para sa sabog o compute sabog hit dahil rsd_search ginagawa nito para sa iyo.
Gayunpaman kung plano mong sa pagtakbo rsd_search maraming beses para sa parehong genomes, lalo na para sa mga malalaking genomes, maaari mong i-save ang oras sa pamamagitan ng paggamit rsd_format sa preformatting ang FASTA mga file at rsd_blast sa precomputing ang sabog hit. Kapag nagpapatakbo rsd_blast, tiyakin na gumamit ng isang --evalue bilang malaking bilang ang pinakamalaking limitasyon evalue nilalayon mong ibigay sa rsd_search.
Narito kung paano i-format ang isang pares ng FASTA file sa lugar:
rsd_format -g mga halimbawa / genomes / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g mga halimbawa / genomes / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
At dito ay kung paano i-format ang FASTA file, paglalagay ng mga resulta sa isa pang direktoryo (ang kasalukuyang direktoryo sa kasong ito)
rsd_format -g mga halimbawa / genomes / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g mga halimbawa / genomes / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Narito kung paano upang makalkula ang pasulong at reverse sabog hit (gamit ang default na evalue):
rsd_blast -v -q mga halimbawa / genomes / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genome = halimbawa / genomes / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--reverse-hit s_q.hits --forward-hit q_s.hits
Narito kung paano upang makalkula ang pasulong at pabalik na sabog mga hit para sa rsd_search, gamit genomes na nai-format para sa sabog at isang hindi-default evalue
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-Genome = Mycobacterium_leprae.aa
--reverse-hit s_q.hits --forward-hit q_s.hits
--no-format --evalue 0.1
Hanapin orthologs pagitan ng lahat ng mga pagkakasunud-sunod sa query at napapailalim genomes gamit genomes na nai-format para sa sabog
rsd_search -q Mycoplasma_genitalium.aa
--subject-Genome = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-format
Hanapin orthologs pagitan ng lahat ng mga pagkakasunud-sunod sa query at napapailalim genomes gamit ang mga hit na nai-compute. Pansinin na --no-format ay kasama, dahil magmula nang sabog hit nai-compute ang genomes Hindi kailangang mai-format para sa sabog.
rsd_search -v --query-Genome Mycoplasma_genitalium.aa
--subject-Genome = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--reverse-hit s_q.hits --forward-hit q_s.hits --no-format
Hanapin orthologs para sa partikular na pagkakasunud-sunod sa query Genome. Para sa paghahanap ng orthologs para lamang ng ilang mga pagkakasunud-sunod, gamit --no-sabog-cache maaaring mapabilis ang pag-compute. YMMV.
mga halimbawa rsd_search -q / genomes / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-Genome = halimbawa / genomes / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o halimbawa / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids mga halimbawa / Mycoplasma_genitalium.aa.ids.txt --no-sabog-cache
Output Format
Orthologs maaaring i-save sa ilang iba't ibang mga format gamit ang --outfmt pagpipilian ng rsd_search. Ang default na format, --outfmt -1, ay tumutukoy sa --outfmt 3. May inspirasyon ng Uniprot dat file, isang set ng mga orthologs nagsisimula sa isang parameter ng linya, pagkatapos ay may 0 o higit pang mga ortholog linya, pagkatapos ay mayroong isang dulo ng linya. Ang parametes ang mga pangalan query Genome, nakabatay pangalan Genome, limitasyon ng pagkakaiba-iba, at hangganan ng evalue. Ang bawat ortholog ay nasa solong linya na naglilista ng mga pagkakasunud-sunod id query, ang pagkakasunud-sunod ng paksa id, at ang maximum pagtantya ng posibilidad na distansya. Ang format na ito ay maaaring kumatawan sa orthologs para sa maramihang mga hanay ng mga parameter sa isang solong file pati na rin ang mga hanay ng mga parameter na walang orthologs. Samakatuwid ito ay angkop para sa paggamit sa rsd_search kapag tumutukoy ng maramihang mga pagkakaiba-iba at evalue mga hangganan.
Narito ang isang halimbawa na naglalaman ng 2 mga kumbinasyon parameter, isa rito ay walang orthologs:
PA tLACJO tYEAS7 t0.2 t1e-15
O tQ74IU0 tA6ZM40 t1.7016
O tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Ang orihinal na format ng RSD, --outfmt 1, ay ibinigay para sa mga pabalik na compatibility. Ang bawat linya ay naglalaman ng isang ortholog, kinakatawan bilang pagkakasunud-sunod paksa id, pagkakasunud-sunod id query, at maximum na pagtantya ng posibilidad na distansya. Maaari lamang ito kumakatawan sa isang solong hanay ng mga orthologs sa isang file.
Halimbawa:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Ipinapagamit din para sa mga pabalik na compatibility ay isang format na ginagamit panloob ng pag-iipon (http://roundup.hms.harvard.edu/) na kung saan ay tulad ng sa orihinal na format RSD, maliban sa hanay ng pagkakasunod-sunod query id ay bago ang pagkakasunud-sunod ng paksa id.
Halimbawa:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Mga Kinakailangan :

  • Python
  • NCBI sabog 2.2.24
  • PAML 4.4
  • Kalign 2.04

Katulad na software

Seal
Seal

14 Apr 15

E-Cell System
E-Cell System

11 May 15

misopy
misopy

20 Feb 15

SSuMMo
SSuMMo

14 Apr 15

Mga komento sa reciprocal_smallest_distance

Mga Komento hindi natagpuan
Magdagdag ng komento
I-sa mga imahe!