Nyt tulee Sora! Katso kaikki OpenAI Sora videot täältä

Teresa Maria
| 6 min read

OpenAI Sora

Tekoälypioneerin uusin innovaatio, OpenAI Sora, pystyy luomaan hyvin realistisia videoita pelkistä sanoista. Samalla kun ChatGPT on jo muuttanut maailmaa ja eri alojen toimintatapoja monin tavoin, nyt sen luoja, OpenAI, uhkaa yhä laajemmin luovia aloja sen uudella innovaatiolla.

OpenAI Sora on nimenomaan videoiden luomiseen tarkoitettu uusi generatiivista tekoälyä hyväksi käyttävä työkalu. Se eroaa aiemmista tekoäly videogeneraattoreista siinä, että Sora kykenee luomaan erittäin realistisia, lyhyitä videoita lähes välittömästi pelkkien sanakehotteiden perusteella.

Vaikka Sora ei olekaan ensimmäinen laatuaan, monet alan asiantuntijat ovat jo kommentoineet sen ylivoimaista kykyä luoda laadukasta videosisältöä huomattavasti pienemmällä vaivalla. Samojen asiantuntijoiden mukaan tämä on valtava harppaus eteenpäin Soran kehittäneelle OpenAI:lle.

Samalla, kun teknologiasta kiinnostuneet hierovat käsiään, luovien alojen työntekijät kaivautuvat yhä syvemmälle poteroihinsa pohtimaan, miten tämä uusi uhka voitaisiin ylittää. Lisäksi tekoälymarkkinoilla ollaan yleisesti ottaen hyvin tietoisia kaikista niistä vaaroista, joita tämä uusi teknologia on tuonut eetteriin.

Tässä artikkelissa keskustelemme kaikesta, mitä OpenAI:n Soralla voi tehdä, sen vahvuuksista ja heikkouksista, sekä perehdymme tekoälyn mukana tuleviin uhkiin, joista jokaisen on hyvä olla tietoinen.

Suomalainen, vuonna 2004 perustettu, luovien alojen klusteri RINKI on koonnut yhteen OpenAI:n julkaisemia Sora videoita. OpenAI Sora esimerkkivideot ovat katsottavissa alapuolelta, video sisältää kaikki OpenAI Sora -videot:

Mitä OpenAI Sora pystyy tekemään?


Tällä hetkellä asiantuntijoille ja luovan alan työntekijöille rajoitettu OpenAI Sora on tekoälyä hyväksi käyttävä videogeneraattori, jolla voidaan luoda hyvälaatuisia, korkeintaan 60 sekunnin mittaisia videopätkiä hyvin helposti.

Sora luo videoita pelkkien sanallisten kehotteiden mukaan, mutta se pystyy luomaan videoita myös stillkuvan perusteella. Yleisesti ottaen Sora voidaan nähdä helppokäyttöisempänä ja paranneltuna versiona OpenAI:n aiemmin lanseeraamasta kuvageneraattorista, DALL-E:sta.

Kuten aiemmin mainitsimme, Soran käyttö on tällä hetkellä rajoitettu asiantuntijoihin ja luovan alan tekijöihin. OpenAI kertoo käyvänsä keskusteluja poliittisten päättäjien kanssa ennen kuin ohjelma tuodaan julkisesti tarjolle.

Näin ollen tietomme tämän videogeneraattorin käytöstä ovat rajalliset, mutta OpenAI on jakanut runsaasti esimerkkejä siitä, mihin kaikkeen Sora pystyy. Yllä olevasta Youtube-videosta löydät kaikki OpenAI Sora videot, jotka yhtiö on julkaissut esimerkeiksi.

OpenAI:n toimitusjohtaja Sam Altman on myös itse tarjonnut esimerkkejä Soran kyvyistä. Hän julkaisi X:ssä, eli aiemmin Twitterinä tunnetulla sosiaalisen median alustalla seuraajiensa sanallisiin kehotteisiin perustuvia esimerkkivideoita, jotka Sora oli luonut.

Alla oleva video esimerkki luotiin perustuen sanoihin “pyöräilykilpailu merellä eri eläinten kesken urheilijoina ajamassa polkupyöriä dronekameranäkymällä”.

 

Sora vahvuudet


Kuten CNet raportoi aiemmin tällä viikolla, heidän tietojensa mukaan seikka, joka voisi erottaa Soran aiemmista kilpailijoista, on sen kyky luoda laadukkaita videoita jopa hyvin pitkien sanallisten kehotteiden mukaan. Raportin mukaan pisin esimerkki, joka Soralle on annettu, oli jopa 135 sanaa pitkä.

OpenAI Sora kykenee näin ollen luomaan laadukkaita videoita liittyen mihin tahansa maan päällä. Oli kyseessä sitten eläin, alue, maisema, asento, mitä tahansa saatat keksiä.

Monet alan asiantuntijat ovat verranneet Soraa OpenAI:n aiemmin lanseeraaman kuvageneraattorin, DALL-E:n uusimpaan versioon. Vaikka toinen luokin kuvia ja toinen videoita, niiden teknologisen kehityksen perusteella voidaan nähdä OpenAI:n ottamat valtavat kehitysaskeleet.

CNET:in Stephen Shankland kommentoi asiaa seuraavasti: “Sora pystyy luomaan monimutkaisia kohtauksia, joissa on useita hahmoja, tietyntyyppisiä liikkeitä ja tarkkoja yksityiskohtia eri aiheista ja taustasta.”

Hän jatkoi: “Malli ei ymmärrä vain sitä, mitä käyttäjä on pyytänyt kehotteessa, vaan myös sen, kuinka nämä asiat ovat fyysisessä maailmassa.”

Mitä tulee OpenAI:n julkaisemiin esimerkkivideoihin, ne ovat yleisesti ottaen hyvin realistisen näköisiä. Mutta tarkemmassa tarkastelussa ihminen pystyy erottamaan, että erityisesti ihmiskasvot ja vaikka meressä uiva hai, eivät täysin muistuta oikean elämän realiteetteja. Vielä!

Shankland kommentoi myös Soran kykyjä luoda realistista sisältöä: “Sora toimii perustana malleille, jotka voivat ymmärtää ja simuloida todellista maailmaa, mikä on kyky, jonka uskomme olevan tärkeä virstanpylväs AGI:n saavuttamisessa.”

AGI:lla hän viittaa tekoälyn kehittyneempään muotoon, mikä vastaa ihmisen älykkyyttä paremmin, kuin tämän hetkiset tekoälytyökalut. Lisäksi tältä tekoälyn muodolta löytyy kyky suorittaa laajempia tehtäväkokonaisuuksia. Esimerkiksi Microsoft sekä entinen Facebook, nykyinen Meta on mukana tässä kehitystyössä.

OKX mainosbanneri CTA

Sora heikkoudet


Aivan samalla tavalla, kuin ihminen on kaukan täydellisyydestä, myös tekoälyyn liittyy paljon heikkouksia. Esimerkiksi OpenAI Sora pystyy luomaan videoita vain sellaisiin asioihin ja ilmiöihin liittyen, jotka se tuntee.

Lisäksi sen luonut yhtiö on myöntänyt, että kehitystyötä on vielä tehtävä Soran kyvyssä kuvata monimutkaisia fysiikan elementtejä, sekä kyvyssä ymmärtää syy ja seuraussuhteita.

OpenAI on kommentoinut asiaa seuraavasti: “Esimerkiksi henkilö saattaa purra keksiä, mutta sen jälkeen videolla näkyvässä keksissä ei välttämättä näy puremanjälkeä.”

Lisäksi on huomattu, että Soralle on vielä vähän epäselvää, mikä on vasen ja mikä oikea. OpenAI kehittää videogeneraattoria edelleen, samalla kun se käy keskusteluja Yhdysvaltain poliitikkojen kanssa sen kehityksestä. Soraa ei siis tuoda julkisesti saataville ennen, kuin edellä mainitut heikkoudet on korjattu.

Lisäksi OpenAI on ottanut asiakseen varmistaa, että Soran julkaistava versio tulee olemaan olemassa olevien turvallisuusstandardien mukainen. Tämä tarkoittaa, että OpenAI Sora ei pystyisi luomaan sisältöä, joka olisi väkivaltaista, seksuaalista, vihamielistä, julkisuuden henkilöiden kaltaista tai rikkoisi immateriaalioikeuksia.

“Laajoista tutkimuksista ja testauksista huolimatta emme voi ennustaa kaikkia tapoja, joilla ihmiset käyttävät teknologiaamme, emmekä kaikkia tapoja, joilla ihmiset voivat käyttää sitä väärin”, yhtiöstä on lisätty.

“Siksi uskomme, että tosielämän käytöstä oppiminen on kriittinen osa luotaessa ja julkaistaessa yhä turvallisempia tekoälyjärjestelmiä ajan myötä.”

Lue oppaamme: Kattava Snapchat opas

OpenAI Sora aiheuttaa lisää huolta luovien alojen ammattilaisten keskuudessa


Vaikka OpenAI tuntuu ottavan tekoälyn mahdollisen käytön rikollisiin ja epärehellisiin, jopa väkivaltaisiin tarkoituksiin vakavasti, varsinkin luovalla alalla tekoälyn nopea kehitys huolettaa monia.

Esimerkiksi yhdysvaltalaiseen supertähti, Taylor Swiftiin liittynyt deepfake-skandaali ylitti uutiskynnyksen kaikkialla maailmassa. Se toi samalla esille tekoälyn järkyttävän puolen, jota ei tähän mennessä ole otettu tarpeeksi vakavasti tekoälyn kehitystyössä.

Lisäksi on esitetty huolia siitä, minkälaista vahinkoa tekoälyllä tuotettu sisältö voi aiheuttaa esimerkiksi vaalien alla. Väärän tiedon levittäminen sai ihmiset toimimaan eri tavoin jo ennen tekoälyn kehittämistä, joten nyt poliitikkojen ja tekoälykehittäjien edessä on entistä suurempi haaste propagandan ja valheellisen tiedon leviämisen estämiseksi.

Fred Havemeyer, yhdysvaltalainen yritysohjelmistoanalyytikko, kommentoi asiaa näin: “Generatiivisen tekoälyn negatiiviset ulkoiset vaikutukset ovat kriittinen keskustelunaihe vuonna 2024 … Se on merkittävä ongelma, joka jokaisen yrityksen ja jokaisen ihmisen on kohdattava tänä vuonna.”

Samalla kun tekoälyä kehittävät yhtiöt pyrkivät ratkaisemaan näitä tekoälyn ongelmia, maiden hallitukset laahaavat niin pitkällä perässä, että kehitystyö hidastuu väkisinkin.

Esimerkiksi Euroopan unionissa päästiin sopuun kattavista tekoälyä koskevista säännöistä ensimmäisenä maailmassa, mutta kyseinen laki tulee voimaan vasta kaksi vuotta sen jälkeen, kun laki hyväksytään.

OpenAI Sora ollaan kuitenkin ilmeisesti pitämässä vielä vakan alla, kunnes sen turvaominaisuudet on varmistettu ja testattu kunnolla. “Kehitämme myös työkaluja, jotka auttavat havaitsemaan harhaanjohtavaa sisältöä, kuten tunnistusluokitinta, joka voi kertoa, milloin Sora on luonut videon.”

Asiasta keskusteltiin myös Münchenin turvallisuuskonferenssissa, jossa OpenAi ja 19 muuta teknologiayritystä lupautuivat tekemään töitä tekoälyn käyttäjien turvallisuuden takaamiseksi jatkossa.