• banner

OpenAI Point E: Theha leru la lintlha tsa 3D ho tsoa ho liforomo tse rarahaneng ka metsotso ho GPU e le 'ngoe

Sengoliloeng se secha Point-E: Sistimi ea ho hlahisa maru a ntlha ea 3D ho tsoa ho mats'oao a rarahaneng, sehlopha sa lipatlisiso sa OpenAI se hlahisa Point E, sistimi ea 3D point cloud text conditional synthesis system e sebelisang mefuta ea phallo ho theha libopeho tse fapaneng le tse rarahaneng tsa 3D tse tsamaisoang ke mongolo o rarahaneng. malebela.ka metsotso e seng mekae ka GPU e le 'ngoe.
Ts'ebetso e makatsang ea mefuta ea morao-rao ea mehleng ea kajeno ea ho hlahisa litšoantšo e khothalelitse lipatlisiso ho hlahisa lintho tse ngotsoeng tsa 3D.Leha ho le joalo, ho fapana le mefuta ea 2D, e ka hlahisang tlhahiso ka metsotso kapa metsotsoana, mefuta e hlahisang lintho hangata e hloka lihora tse 'maloa tsa mosebetsi oa GPU ho hlahisa sampole e le' ngoe.
Sengoliloeng se secha Point-E: Sistimi ea ho hlahisa maru a ntlha ea 3D ho tsoa ho matšoao a rarahaneng, sehlopha sa lipatlisiso sa OpenAI se hlahisa Point·E, mokhoa oa ho kopanya maemo a mongolo bakeng sa maru a ntlha a 3D.Mokhoa ona o mocha o sebelisa mohlala oa phatlalatso ho theha libopeho tse fapaneng le tse rarahaneng tsa 3D ho tsoa ho matšoao a mongolo o rarahaneng ka motsotso kapa e 'meli ho GPU e le' ngoe.
Sehlopha se tsepamisitse maikutlo phephetsong ea ho fetolela mongolo ho 3D, e leng bohlokoa bakeng sa ho theha demokrasi ea tlhahiso ea litaba tsa 3D bakeng sa lits'ebetso tsa nnete tsa lefats'e ho tloha ho 'nete ea nnete le lipapali ho isa ho moralo oa indasteri.Mekhoa e teng ea ho fetolela mongolo ho 3D e oela ka mekhahlelo e 'meli, e' ngoe le e 'ngoe e na le mefokolo ea eona: 1) mefuta e hlahisang lihlahisoa e ka sebelisoa ho hlahisa lisampole ka mokhoa o atlehileng, empa e ke ke ea eketseha ka katleho bakeng sa matšoao a fapaneng le a rarahaneng a mongolo;2) mohlala oa sets'oants'o sa mongolo o koetlisitsoeng esale pele ho sebetsana le lintlha tse rarahaneng le tse fapaneng tsa mongolo, empa mokhoa ona o matla ka ho fetesisa mme mohlala o ka ts'oaroa habonolo ho minima ea lehae e sa tsamaellaneng le lintho tse nang le moelelo kapa tse momahaneng tsa 3D.
Ka hona, sehlopha se ile sa hlahloba mokhoa o mong o ikemiselitseng ho kopanya matla a mekhoa e 'meli e ka holimo, ho sebelisa mokhoa oa ho hasanya mongolo ho ea ho setšoantšo o koetliselitsoeng ho sehlopha se seholo sa lipara tsa litšoantšo tsa mongolo (ho lumella ho sebetsana le matšoao a sa tšoaneng le a rarahaneng) le mofuta oa 3D oa ho hasanya litšoantšo o koetliselitsoeng ka sete e nyane ea lipara tsa litšoantšo tsa mongolo.setšoantšo-3D para dataset.Moetso oa mongolo ho ea ho setšoantšo o qala lisampole tsa setšoantšo se kentsoeng ho theha sets'oants'o se le seng sa maiketsetso, 'me setšoantšo sa 3D se theha leru la lintlha tsa 3D ho latela setšoantšo se khethiloeng.
Pokello ea taelo e ipapisitse le meralo ea tlhahiso ea morao-rao bakeng sa ho hlahisa litšoantšo ho tsoa mongolong (Sohl-Dickstein et al., 2015; Song & Ermon, 2020b; Ho et al., 2020).Ba sebelisa mohlala oa GLIDE o nang le liparamente tsa GLIDE tse limilione tse likete tse 3 (Nichol et al., 2021), tse hlophisitsoeng hantle ho mefuta e fanoeng ea 3D, joalo ka mohlala oa bona oa phetoho ea mongolo ho ea ho setšoantšo, le mefuta e mengata ea phallo e hlahisang maru a RGB joalo ka bona. sebopeho sa phetoho.litšoantšo ho setšoantšo.Mefuta ea 3D.
Le hoja mosebetsi o fetileng o ne o sebelisa meralo ea 3D ho sebetsana le maru a ntlha, bafuputsi ba sebelisitse mohlala o bonolo oa transducer-based (Vaswani et al., 2017) ho ntlafatsa katleho.Moetsong oa bona oa meaho ea phallo, litšoantšo tsa maru li qala ho feptjoa ka mokhoa o koetlisitsoeng esale pele oa ViT-L/14 CLIP ebe li-meshes tse hlahisoang li kenngoa ka har'a converter joalo ka matšoao.
Thutong ea bona e matla, sehlopha se ile sa bapisa mokhoa o reriloeng oa Point·E le mefuta e meng ea tlhahiso ea 3D mabapi le matšoao a tsoang ho ho lemoha ntho ea COCO, karohano, le li-database tsa mesaeno.Liphetho li tiisa hore Point·E e khona ho hlahisa libopeho tse fapaneng le tse rarahaneng tsa 3D ho tloha matshwaong a rarahaneng a mongolo le ho potlakisa nako ea ho fana ka taelo e le 'ngoe ho isa ho tse peli tsa boholo.Sehlopha se ts'epa hore mosebetsi oa bona o tla khothaletsa lipatlisiso tse ling mabapi le motsoako oa mongolo oa 3D.
Moetso oa phatlalatso oa maru o koetlisitsoeng esale pele le khoutu ea tlhahlobo lia fumaneha ho GitHub ea projeke.Document Point-E: Sistimi ea ho theha maru a ntlha a 3D ho tsoa ho lintlha tse rarahaneng e ho arXiv.
Rea tseba hore ha u batle ho fetoa ke litaba kapa litšibollo tsa saense.Ingolise ho koranta ea rona e tsebahalang ea Synced Global AI ea Beke le beke ho fumana lintlha tsa beke le beke tsa AI.


Nako ea poso: Dec-28-2022