Das holländische Unternehmen Genalice mit Sitz in Harderwijk bietet mit MAP eine Soft- und Hardwarelösung an, welche es erlaubt die Rohdaten aus einer kompletten menschlichen Sequenzierung (NGS complete human genome as FASTQ) in weniger als 30 Minuten zu analysieren und eine Variantdatei (VCF) zu generieren. Weitere Meilensteine laut Firmenangaben:
- 100x schnellere Ausrichtung (Alignment) und Kartierung (Mapping) im Vergleich zu bisher verwendeten Lösungen (BWA-MEM/GATK);
- findet ca. 98% der SNPs, bisher bis zu 95% üblich;
- signifikante Datenreduzierung durch Verwendung des (neuen?) GAR-Dateiformats (Beispiel 2 GB statt 25 GB BAM oder 88 GB FASTQ) und gleichzeitige Rückwertskompatibilität zu den alten Formaten;
- Vereinfachung des Arbeitsablaufs: zwei Schritte mit einer Software, statt fünf Schritten mit mehreren Softwarepaketen;
Die große Frage: während ansonsten freie Open-Source-Programme verfügbar sind, scheint MAP und GAR proprietär zu sein.
Nachtrag 31. Juli
Genalice hat auf die Anfrage geantwortet: „MAP algorithms and the GAR file format patents are pending. Third party providers/solutions can integrate our innovative NGS data processing pipeline in their offerings.“ „GAR free conversion toolkit available to generate VCF, BAM or SAM„.
Also leider bleibt das Speicherformat in FOSS-Anwendungen somit wohl außen vor. Hoffentlich wurden nicht einfache Logiken, wie die Verwendung von Referenzsequenzen, patentiert (die Anfrage diesbezüglich blieb unbeantwortet). Insgesamt bleibt zu hoffen, das auch FOSS-Tools erscheinen werden, welche eine ähnliche Performance bieten können, bzw. ein Speicherformat, welches frei und ebenso speicherschonend ist.