శాస్త్రవేత్తలు కొత్త రకం మెషీన్ లెర్నింగ్ మోడల్ను అభివృద్ధి చేశారు, అది జన్యుపరమైన సూచనలను అర్థం చేసుకోవచ్చు మరియు రూపొందించవచ్చు.
Evo అని పిలవబడే మోడల్, జన్యు ఉత్పరివర్తనాల ప్రభావాలను అంచనా వేయగలదు మరియు కొత్త DNA శ్రేణులను ఉత్పత్తి చేయగలదు – అయినప్పటికీ ఆ DNA శ్రేణులు జీవుల DNAకి దగ్గరగా సరిపోలలేదు.
అయితే, సమయం మరియు శిక్షణతో, Evo మరియు సారూప్య నమూనాలు శాస్త్రవేత్తలు వివిధ DNA మరియు RNA శ్రేణుల విధులను అర్థం చేసుకోవడంలో మరియు వ్యాధిని తగ్గించడంలో సహాయపడతాయి, పరిశోధకులు నవంబరు 15న పత్రికలో ప్రచురించిన కొత్త అధ్యయనంలో రాశారు. సైన్స్.
ఈవో ఒక రకం కృత్రిమ మేధస్సు (AI) సిస్టమ్ లార్జ్ లాంగ్వేజ్ మోడల్ (LLM) అని పిలుస్తారు, ఇది OpenAI యొక్క GPT-4 లేదా Google యొక్క మాదిరిగానే ఉంటుంది మిధునరాశి. పరిశోధకులు మరియు డెవలపర్లు LLMలకు ఇంటర్నెట్ వంటి బహిరంగంగా అందుబాటులో ఉన్న వనరుల నుండి అధిక మొత్తంలో డేటాపై శిక్షణ ఇస్తారు మరియు LLMలు ఒక వాక్యంలో పదాలను ఒక్కొక్కటిగా అందించడానికి ఆ నమూనాలను ఉపయోగించి సాధారణ పదబంధాలు లేదా సాధారణ వాక్య నిర్మాణాల వంటి నమూనాల కోసం చూస్తాయి.
సాధారణ LLMల వలె కాకుండా, Evo పదాలపై శిక్షణ పొందలేదు. బదులుగా, ఇది మిలియన్ల కొద్దీ సూక్ష్మజీవుల జన్యువులపై శిక్షణ పొందింది – ఆర్కియా, బ్యాక్టీరియా మరియు వాటిని సోకే వైరస్లు, కానీ మొక్కలు మరియు జంతువుల వంటి యూకారియోటిక్ జీవులపై కాదు. ప్రతి బేస్ జత — DNAను రూపొందించే ప్రాథమిక రసాయన యూనిట్లు — ఆ జన్యువుల నుండి మోడల్లో “పదం” వలె పనిచేస్తుంది. Evo DNA యొక్క స్ట్రాండ్ ఎలా పనిచేస్తుందో అంచనా వేయడానికి లేదా కొత్త జన్యు పదార్థాన్ని రూపొందించడానికి దాని శిక్షణా సెట్తో బేస్ జతల శ్రేణులను పోల్చింది.
ఇతర నమూనాలు ఇప్పటికే జన్యుపరమైన సమాచారాన్ని పరిశీలించడానికి మెషిన్ లెర్నింగ్ మరియు LLMలను కూడా ఉపయోగించాయి. కానీ ఇప్పటివరకు అవి ప్రత్యేకమైన విధులకు పరిమితం చేయబడ్డాయి లేదా అధిక గణన వ్యయంతో ఆటంకం కలిగి ఉన్నాయి, శాస్త్రవేత్తలు అధ్యయనంలో రాశారు. Evo, దీనికి విరుద్ధంగా, సుదీర్ఘమైన సమాచారాన్ని ప్రాసెస్ చేయడానికి వేగవంతమైన, అధిక-రిజల్యూషన్ మోడల్ను ఉపయోగిస్తుంది, ఇది జన్యు స్కేల్లో నమూనాలను విశ్లేషించడానికి మరియు మరిన్ని ప్రత్యేక నమూనాలు మిస్ అయ్యే పెద్ద-స్థాయి పరస్పర చర్యల గురించి సమాచారాన్ని సంగ్రహించడానికి అనుమతిస్తుంది.
రచయితలు ఈవోను వరుస పనులపై పరీక్షించారు. జన్యు ఉత్పరివర్తనలు ప్రోటీన్ నిర్మాణాలను ఎలా ప్రభావితం చేస్తాయో Evo అంచనా వేసింది, ఆ పని కోసం ప్రత్యేకంగా శిక్షణ పొందిన నమూనాలతో పోల్చవచ్చు. ఇది ప్రయోగశాల పరీక్షలలో వైరల్ ఇన్ఫెక్షన్ నుండి రక్షించే ఒక ప్రోటీన్ మరియు RNA భాగాలను కూడా ఉత్పత్తి చేసింది.
Evo మొత్తం జన్యువుల పరిమాణంలో DNA యొక్క సీక్వెన్స్లను కూడా రూపొందించింది – కానీ DNA తప్పనిసరిగా ఏదో సజీవంగా ఉంచదు. కొన్ని జన్యు సూచనలు ఇప్పటికే ఉన్న జీవులలో DNA వలె ఉన్నాయి. మరికొందరు మొదటి చూపులో సారూప్యంగా కనిపించారు, కానీ చాలా వేళ్లు ఉన్న వ్యక్తి యొక్క AI- రూపొందించిన చిత్రం వలె దగ్గరగా పరిశీలించినప్పుడు అర్థం కాలేదు. ఉదాహరణకు, Evo-ఉత్పత్తి DNAలో ఎన్కోడ్ చేయబడిన అనేక ప్రోటీన్ నిర్మాణాలు సహజంగా సంభవించే ప్రోటీన్లతో సరిపోలడం లేదు.
“ఈ నమూనాలు కీలకమైన లక్షణాలను కలిగి ఉన్న జన్యువు యొక్క ‘అస్పష్టమైన ఇమేజ్’ని సూచిస్తాయి కానీ సహజ జన్యువులకు విలక్షణమైన సూక్ష్మ-కణిత వివరాలను కలిగి ఉండవు” అని పరిశోధకులు అధ్యయనంలో రాశారు.
వారు ఎవోకు సూక్ష్మజీవుల జన్యువులపై మాత్రమే శిక్షణ ఇచ్చారు, కాబట్టి మానవ జన్యు ఉత్పరివర్తనాల ప్రభావాలను అంచనా వేయడం ఇప్పటికీ దాని పట్టులో లేదు. విమర్శనాత్మకంగా, ఈవో వంటి సాధనాలు వాటి పనితీరు మెరుగుపడినప్పుడు దుర్వినియోగం కాకుండా నిరోధించడానికి భద్రత మరియు నైతిక మార్గదర్శకాల అవసరాన్ని బృందం నొక్కి చెప్పింది. ముఖ్యంగా, బృందం సోకే వైరల్ జన్యువులపై డేటాను మినహాయించింది యూకారియోటిక్ అతిధేయలు.
“దుర్వినియోగాన్ని నిరోధించడానికి మరియు ఇప్పటికే ఉన్న మరియు ఉద్భవిస్తున్న బెదిరింపులను తగ్గించడానికి సమర్థవంతమైన వ్యూహాలను ప్రోత్సహించడానికి శాస్త్రీయ సంఘం, భద్రతా నిపుణులు మరియు విధాన రూపకర్తలతో కూడిన చురుకైన చర్చ అత్యవసరం” అని పరిశోధకులు రాశారు.