Covid-19

Razviti pristop bo mogoče uporabiti tudi za druge tematike. Naslonitev na *Rxiv-e omogoča vpogled v tekoče dogajanje. Uporaba bibliografskih baz kot sta WoS in Scopus vnaša vsaj nekajmesečni zamik.

Analiza literature o epidemiji Covid-19

Zaradi kratkega časovnega obdobja in zamika pri recenzijah WoS ni najustreznejši vir bibliografskih podatkov. Nasloniti se bo potrebno na vire kot so:

  1. Google scholar. Articles about COVID-19: CDC, NEJM, JAMA, Lancet, Cell, BMJ, Nature, Science, Elsevier, Oxford, Wiley, medRxiv

Najprej pregled nekaj člankov → izbor iskalnih gesel.

Težave utegnejo biti s pridobivanjem omrežja sklicevanj, ker bi v večini primerov morali vire (reference) pridobiti iz samih del (člankov, knjig, poročil, …).

Lažje bi bilo najbrž sestaviti:

  • omrežje avtorstev: dvovrstno omrežje dela X avtorji
  • omrežje gesel: dvovrstno omrežje dela X gesla
  • vektor datumov objave
    • objava na ArXiv-u
    • poslano v revijo
    • objavljeno v reviji
  • vektor/razbitje po področju (math, phys, cs, soc, med, bio, …)
  • vektor vira (skladišče, revija, …)

morda še

  • dvovrstno omrežje avtorji X države

Problemi

  • sinonimi / homonimi enot
  • gesla: enobesedna / fraze; lematizacija

Zasičevanje - dodajanje opisov pogosto citiranih del, pomembnih avtorjev, …

Analize

Porazdelitve, izpeljana omrežja: sopojavljanje avtorjev (soavtorstvo), sopojavljanje gesel; normalizacija omrežij. Pomembne skupine: otoki, sredice, razvrščanje.

Opombe

Med brskanjem sem naletel na COVIDScholar: An automated COVID-19 research aggregation and analysis platform (čisto svež). Veljalo bi pogledati kaj vse omogoča. Covid scholar. Github. Dobro bi bilo navezati stik z njimi in dobiti dostop do podatkov.

Druga možnost je, da se naslonimo na podatke s Semantic scholar. opis, podatki, samo metada (~500MB). Metadata.csv vsebuje polja: cord_uid, sha, source_x, title, doi, pmcid, pubmed_id, license, abstract, publish_time, authors, journal, mag_id, who_covidence_id, arxiv_id, pdf_json_files, pmc_json_files, url, s2_id in vsebuje (7. dec.) opise 375095 del. Za opis zgradbe celotnega članka se uporablja oblika zapisa S2ORC JSON vpeljana v S2ORC: The Semantic Scholar Open Research Corpus, Github. Če prav razumem, lahko pridemo za vsaj polovico člankov tudi do sklicevanj. S2ORC metadata 2 Pajek

primer opisa v S2ORC JSON. Vsaka vrstica vsebuje opis nekega članka v JSONu. Za ogled datoteke v Netscape-u je potrebno vse skupaj okleniti z [ ] in med opise postaviti vejice.

Obstaja podatkovje S2ORC z milijoni člankov in sklicev iz različnih disciplin. Zelo zanimivo za posebno analizo.

Zgleda, da je zelo veliko objav na ArXiv-ih: 2,973 (ArXiv) + 11267 (8825 medRxiv, 2442 bioRxiv)

Na bioRxiv je mogoče opis izvoziti v več oblikah. Tudi v BibTeXu in obliki RIS

TY  - JOUR
T1  - Efficient inhibition of SARS-CoV-2 strains by a novel ACE2-IgG4-Fc fusion protein with a stabilized hinge region
JF  - bioRxiv
DO  - 10.1101/2020.12.06.413443
SP  - 2020.12.06.413443
AU  - Svilenov, Hristo L
AU  - Sacherl, Julia
AU  - Reiter, Alwin
AU  - Wolff, Lisa
AU  - Chen, Cho-Chin
AU  - Wachs, Frank-Peter
AU  - Pippig, Susanne
AU  - Wolschin, Florian
AU  - Buchner, Johannes
AU  - Brockmeyer, Carsten
AU  - Protzer, Ulrike
Y1  - 2020/01/01
UR  - http://biorxiv.org/content/early/2020/12/07/2020.12.06.413443.abstract
N2  - The novel severe acute respiratory syndrome (SARS)-like coronavirus (SARS-CoV-2) enters its host cells after binding the angiotensin-converting enzyme 2 (ACE2) via its spike glycoprotein. This interaction is critical for virus entry and virus-host membrane fusion. Soluble ACE2 ectodomains bind and neutralize the virus but the short in vivo half-lives of soluble ACE2 limits its therapeutic use. Fusion of the constant (Fc) part of human immunoglobulin G (IgG) to the ACE2 ectodomain can prolong the in vivo half-life but bears the risk of unwanted Fc-receptor activation and antibody-dependent disease enhancement. Here, we describe optimized ACE2-Fc fusion constructs that avoid Fc-receptor binding by using IgG4-Fc as a fusion partner. The engineered ACE2-IgG4-Fc fusion proteins described herein exhibit promising pharmaceutical properties and a broad antiviral activity at single-digit nanomolar concentration. In addition, they allow to maintain beneficial enzymatic activity of ACE2 and thus are very promising candidate antivirals broadly acting against coronaviruses.Competing Interest StatementThe authors have declared no competing interest.
ER  - 

Viri

  1. Batagelj, V, Cerinšek, M: On bibliographic networks. Scientometrics 96 (2013) 3, 845-864. (DOI) 10.1007/s11192-012-0940-1. arXiv
  2. Cerinšek, M., Batagelj, V.: Network analysis of Zentralblatt MATH data. Scientometrics, 102(2015)1, 977-1001. arXiv
  3. Batagelj, V., Praprotnik, S.: An algebraic approach to temporal network analysis based on temporal quantities. Social Network Analysis and Mining, 6(2016)1, 1-22 Online, arXiv:1505.01569
  4. Batagelj, V., Maltseva, D.: Temporal bibliographic networks. Journal of Informetrics, Volume 14, Issue 1, February 2020, 101006. WWW, https://doi.org/10.1016/j.joi.2020.101006
  5. Batagelj, V.: On fractional approach to analysis of linked networks. Scientometrics 123 (2020) 2: 621-633 on-line; DOI: 10.1007/s11192-020-03383-y
  6. Maltseva, D., Batagelj, V.: Social network analysis as a field of invasions: bibliographic approach to study SNA development. Scientometrics, 121(2019)2, 1085-1128 online, 1-44. DOI 10.1007/s11192-019-03193-x
  7. Maltseva, D., Batagelj, V.: Towards a systematic description of the field using keywords analysis: main topics in social networks. Scientometrics, 123(2020), 357–382. on-line; DOI: 10.1007/s11192-020-03365-0
  8. Maltseva, D., Batagelj, V. iMetrics: the development of the discipline with many names. Scientometrics 125, pages 313–359 (2020). online
  9. Alvaro La Parra-Perez, Félix-Fernando Muñoz, Nadia Fernández de Pinedo: EconHist: A Relational Database for Analyzing the Evolution of Economic History (1980-2019). Academia

Programi, zapiski

Načrt

  1. Uvod:
    1. viri podatkov: S2ORC (+? Covid Scholar; *Rxiv)
    2. opis virov
    3. kaj je bilo že narejeno - druge uporabe/analize
    4. predelava v omrežja
    5. težave pri predelavi
    6. pomen *Rxiv-ov pri odkrivanju “trendov”
    7. statistični pristop
      1. dopolnjevanje s pomembnimi podatki
      2. čiščenje pri “površju”
  2. Analiza avtorjev
    1. porazdelitve; Top30
    2. omrežje sodelovanj Cn
      1. Ps-sredice
      2. enostavni otoki
      3. otoki
    3. pregled rezultatov; če je potrebno: → popravi; → ponovi analizo
  3. Analiza revij
    1. podobno kot pri avtorjih
  4. Analiza ključnih besed - ključne besede iz naslovov in/ali povzetkov
    1. podobno kot pri avtorjih
  5. Izpeljana omrežja
    1. za izbrane skupine (sredice, otoke) določi pripadajoče revije in ključne besede (word clouds)
  6. Časovne analize
  7. Omrežja sklicevanj
  8. Zaključki
    1. kaj manjka pristopu S2ORC
  9. Analiza velikega podatkovja S2ORC

Tehnična in organizacijska vprašanja

  1. Za interpretacijo bi bilo morda dobro vključiti kakega mikrobiologa ali medicinca (bi še počakal, da imamo rezultate).
  2. Kako bomo popravljali podatke:
    1. osnovno podatkovje: vprašanje novih različic - datoteka popravkov in program Update ?
    2. popravki omrežij: skrčitve glede na dano razbitje,
  3. Github, Wiki
  4. računalnik z velikim pomnilnikom (vsaj 32G)
  5. kam bomo poslali članke (kje so bilo objavljeni članki o S2ORC)?

Simulacije

notes/imfm/corona.txt · Last modified: 2021/05/20 05:07 by vlado
 
Except where otherwise noted, content on this wiki is licensed under the following license: CC Attribution-Noncommercial-Share Alike 3.0 Unported
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki