Home టెక్ OpenAI సోరా ఇలా వివరించింది: ఇది ChatGPTకి ఎలా భిన్నంగా ఉంటుంది మరియు దానిని ఎవరు...

OpenAI సోరా ఇలా వివరించింది: ఇది ChatGPTకి ఎలా భిన్నంగా ఉంటుంది మరియు దానిని ఎవరు ఉపయోగించగలరు

3
0

OpenAI చివరకు సోరాను ప్రారంభించింది, దాని అధునాతన టెక్స్ట్-టు-వీడియో జనరేటర్, దీనిని ప్రజలకు అందుబాటులో ఉంచింది. మీరు ChatGPTలో శీఘ్ర ప్రాంప్ట్‌ని సమర్పించడం ద్వారా వేలకొద్దీ పదాలను రూపొందించినట్లే, ఇప్పుడు మీరు Soraలో ప్రాంప్ట్‌లను సమర్పించడం ద్వారా వీడియోలను రూపొందించవచ్చు. అయినప్పటికీ, దాని కార్యాచరణ అంతకు మించినది-మీరు చిత్రాలకు జీవం పోయడానికి వాటిని అప్‌లోడ్ చేయవచ్చు. మీ ముత్తాత యొక్క పాత ఫోటోను సమర్పించి, అతను నడవడం, పరిగెత్తడం లేదా ఇతర చర్యలను చూడటం వంటివి ఊహించుకోండి. మేము ఇక్కడ మాట్లాడుతున్న ఆవిష్కరణ స్థాయి అది. అంటే, మీరు ఆశ్చర్యపోవచ్చు: Sora వెనుక సాంకేతికత అయిన ChatGPTని శక్తివంతం చేసే GPT-4 వంటి LLMల (లార్జ్ లాంగ్వేజ్ మోడల్‌లు) నుండి సోరా ఎలా భిన్నంగా ఉంటుంది? ఇది దేనిపై శిక్షణ పొందింది? మరియు ముఖ్యంగా, ప్రతి ఒక్కరూ సోరాను యాక్సెస్ చేయగలరా? ఈ ప్రశ్నలన్నింటికీ మేము దిగువ సమాధానమిస్తాము – చదవండి.

ఇది కూడా చదవండి: ఐఫోన్ 18 ప్రో చాలా ఎక్కువ ఖర్చు అవుతుంది, ధరల పెంపుకు పెద్ద కారణం…

టెక్స్ట్-బేస్డ్ లార్జ్ లాంగ్వేజ్ మోడల్స్ నుండి సోరా ఎలా విభిన్నంగా ఉంటుంది?

ప్రారంభించడానికి, Sora అనేది టెక్స్ట్-టు-వీడియో AI మోడల్, అయితే GPT అనేది పెద్ద భాషా మోడల్. వారి తేడాలు ఉన్నప్పటికీ, వారు అంగీకరించే ఇన్‌పుట్‌లు కొంతవరకు సమానంగా ఉంటాయి, ఎందుకంటే GPT-4 మల్టీమోడల్-ఇది టెక్స్ట్, ఇమేజ్‌లు మరియు వీడియోలను కూడా ఇన్‌పుట్‌లుగా ప్రాసెస్ చేయగలదు.

ఉదాహరణకు, సోరాతో, మీరు వివరణాత్మక ప్రాంప్ట్‌ను సమర్పించడం ద్వారా పర్వత శిఖరం యొక్క వీడియోను సృష్టించవచ్చు. పర్వతాలు మంచుతో కప్పబడి ఉండాలా, సూర్యుడు ప్రకాశిస్తున్నాడా మరియు ఇతర వివరాలను మీరు పేర్కొనవచ్చు. ఇంకా, మీరు ఇప్పటికే ఉన్న చిత్రాన్ని సోరాకు సమర్పించడం ద్వారా దానికి జీవం పోయవచ్చు. సారాంశంలో, సోరా టెక్స్ట్, ఇమేజ్‌లు లేదా వీడియోలను ఇన్‌పుట్‌లుగా ప్రాసెస్ చేస్తుంది మరియు వీడియోలను అవుట్‌పుట్‌లుగా ఉత్పత్తి చేస్తుంది.

దీనికి విరుద్ధంగా, మీరు టెక్స్ట్ లేదా ఇమేజ్ ఇన్‌పుట్‌లను సమర్పించినప్పటికీ, GPT మోడల్‌లు టెక్స్ట్ అవుట్‌పుట్‌లను మాత్రమే ఉత్పత్తి చేస్తాయి. అవుట్‌పుట్‌లో ఈ వ్యత్యాసం రెండింటినీ వేరు చేస్తుంది.

మీరు ఇలా అడగవచ్చు: ChatGPT లేదా Google Gemini చిత్రాలను రూపొందించగలవు–అవి వరుసగా GPT-4 మరియు జెమిని ద్వారా అందించబడలేదా? సమాధానం లేదు. వారు టెక్స్ట్-టు-ఇమేజ్ జనరేషన్ కోసం DALL-E 3 (OpenAI) మరియు Imagen 3 (Google) వంటి మోడళ్లపై ఆధారపడతారు.

Sora తన సామర్థ్యాలకు మరో కోణాన్ని జోడించి, సమయానికి ముందుకు లేదా వెనుకకు వీడియోలను విస్తరించే సామర్థ్యాన్ని కూడా కలిగి ఉంది.

ఇది కూడా చదవండి: iOS 18.2 ఈ వారం విడుదల: ఐఫోన్ వినియోగదారులు శక్తివంతమైన AI ఫీచర్లను పొందేందుకు…

సోరా ఎలా శిక్షణ పొందాడు?

విభిన్న వ్యవధులు, రిజల్యూషన్‌లు మరియు కారక నిష్పత్తుల వీడియోలు మరియు చిత్రాలపై సోరా శిక్షణ పొందిందని OpenAI పేర్కొంది. ఇది ట్రాన్స్‌ఫార్మర్ ఆర్కిటెక్చర్‌ని ఉపయోగిస్తుందని కంపెనీ పేర్కొంది, ఇది వీడియో మరియు ఇమేజ్ లాటెంట్ కోడ్‌ల స్పేస్-టైమ్ ప్యాచ్‌లను ప్రాసెస్ చేస్తుంది.

సాంకేతిక కోణం నుండి, విధానంలో గణనీయమైన వ్యత్యాసం ఉంది. Sora వంటి టెక్స్ట్-టు-వీడియో మోడల్‌లు విభిన్నంగా శిక్షణ పొందినప్పటికీ, GPT-4o వంటి పెద్ద భాషా నమూనాలు లేదా Meta’s Llama వంటి కంపెనీల ఇతర AI మోడల్‌లు సాధారణంగా మనం టోకెన్‌లుగా సూచించే వాటిపై శిక్షణ పొందుతాయి.

అయితే, టోకెన్‌లకు బదులుగా, OpenAI సోరాకు శిక్షణ ఇవ్వడానికి విజువల్ ప్యాచ్‌లు అనే పద్ధతిని ఉపయోగిస్తుంది. ముఖ్యంగా, ఇది వీడియోలను తక్కువ డైమెన్షనల్ లాటెంట్ స్పేస్‌లోకి కుదించడం ద్వారా వాటిని ప్యాచ్‌లుగా విభజిస్తుంది. తదుపరి ప్రాసెసింగ్ కోసం ప్రాతినిధ్యం స్పేస్-టైమ్ ప్యాచ్‌లుగా కుళ్ళిపోతుంది.

సోరా ఎవరికి అందుబాటులో ఉంది?

ప్రస్తుతం, Sora ఉచిత వినియోగదారులకు అందుబాటులో లేదు. దీనర్థం మీరు సబ్‌స్క్రిప్షన్‌ను కొనుగోలు చేయాలి-ఓపెన్‌ఏఐ ప్లస్ సబ్‌స్క్రిప్షన్ లేదా ఓపెన్ఏఐ ప్రో సబ్‌స్క్రిప్షన్.

ప్లస్ సబ్‌స్క్రిప్షన్, ఇది ఖర్చవుతుంది భారతదేశంలో 2,000, నెలకు 50 సోరా వీడియో తరాలకు యాక్సెస్‌ను అనుమతిస్తుంది. మీరు ప్రో ఖాతాను ఎంచుకుంటే, దీని ధర $200, మీరు గరిష్టంగా 500 వేగవంతమైన వీడియో జనరేషన్‌లను రూపొందించవచ్చు. అయినప్పటికీ, అధిక రిజల్యూషన్‌ని ఎంచుకోవడం వలన అందుబాటులో ఉన్న తరాల సంఖ్య తగ్గుతుంది. మీరు ఓపికగా ఉండి, స్లో జనరేషన్ మోడ్‌ని ఉపయోగించడానికి ఇష్టపడితే, మీరు అపరిమిత వీడియో తరాలను ఆస్వాదించవచ్చు.

రిజల్యూషన్‌పై క్యాప్ ఉందని గమనించడం ముఖ్యం మరియు వీడియోలు 20 సెకన్ల వరకు మాత్రమే ఉంటాయి. అవి వైడ్ స్క్రీన్, వర్టికల్ లేదా స్క్వేర్ యాస్పెక్ట్ రేషియోలలో అందుబాటులో ఉంటాయి.

ప్రత్యేకతల కోసం, OpenAI Plus (లేదా ChatGPT ప్లస్) వినియోగదారులు 50 వీడియోల పరిమితితో 480p రిజల్యూషన్‌తో వీడియోలను రూపొందించవచ్చు. 720p ఉత్పత్తి సాధ్యమే, ఫలితంగా వచ్చే వీడియోల సంఖ్య తక్కువగా ఉంటుంది.

విపరీతమైన డిమాండ్ కారణంగా, OpenAI ప్రస్తుతం Sora కోసం కొత్త సైన్అప్‌లను అనుమతించడం లేదు. OpenAI CEO సామ్ ఆల్ట్‌మాన్ సైన్అప్‌లు తాత్కాలికంగా పాజ్ చేయబడిందని ధృవీకరించారు, అయితే డిమాండ్ స్థిరీకరించబడిన తర్వాత మళ్లీ ప్రారంభమవుతుంది. ఈ సమస్యలను వీలైనంత త్వరగా పరిష్కరించడానికి OpenAI తన వంతు కృషి చేస్తోందని అతను వినియోగదారులకు హామీ ఇచ్చాడు. అయినప్పటికీ, ప్రతి ఒక్కరూ సోరాను యాక్సెస్ చేయడానికి కొంత సమయం పట్టవచ్చు. మీరు త్వరలో యాక్సెస్ పొందకపోతే, అది అధిక డిమాండ్ కారణంగా ఉంటుంది.

ఇది కూడా చదవండి: iPhone 17 Air iPhone 16 Pro కంటే 2mm సన్నగా ఉండే అవకాశం ఉంది: మరిన్ని వివరాలను ఇక్కడ చూడండి