В быстро развивающемся мире крупномасштабных вычислений появление революционного достижения, способного встряхнуть сферу 3D-визуализации, было лишь вопросом времени. Adobe Research и Австралийский национальный университет (ANU) анонсировали первую модель искусственного интеллекта , способную генерировать 3D-изображения из одного 2D-изображения. Исследователи говорят, что их новый алгоритм, который обучается на массивных выборках изображений, может изменить процесс создания 3D-моделей и способен генерировать такие 3D-изображения за считанные секунды. Иконг Хонг, стажер Adobe и бывший аспирант Колледжа инженерии, вычислительной техники и кибернетики АНУ, сказал, что их модель большой реконструкции (LRM) основана на хорошо масштабируемой нейронной сети, содержащей один миллион наборов данных с 500 миллионами параметров. Такие наборы данных включают изображения, 3D-фигуры и видео. «Такое сочетание высокопроизводительной модели и крупномасштабных обучающих данных позволяет нашей модели быть легко обобщаемой и создавать высококачественные 3D-реконструкции на основе различных входных данных тестирования», — сказал Хонг, ведущий автор отчета о проекте. «Насколько нам известно, [наша] LRM — это первая крупномасштабная модель 3D-реконструкции». Можно ожидать, что системы дополненной и виртуальной реальности , игры, кинематографическая анимация и промышленный дизайн извлекут выгоду из преобразующей технологии. Раннее программное обеспечение для 3D-изображений хорошо себя зарекомендовало только в определенных предметных категориях с заранее установленными формами. Хонг объяснил, что более поздние успехи в создании изображений были достигнуты с помощью таких программ, как DALL-E и Stable Diffusion, которые «использовали замечательные возможности обобщения 2D-моделей диффузии для обеспечения возможности создания нескольких изображений». Однако результаты этих программ ограничивались предварительно обученными 2D-генеративными моделями. Другие системы использовали оптимизацию по форме для достижения впечатляющих результатов, но, по словам Хонга, они «часто медленны и непрактичны». По словам Хонга, эволюция моделей естественного языка в массивных трансформаторных сетях, которые использовали крупномасштабные данные для максимизации задач прогнозирования следующего слова, побудила его команду задаться вопросом: «Можно ли изучить общую трехмерную модель, прежде чем реконструировать объект из одно изображение ?» Их ответ был «Да». «LRM может реконструировать высокоточные 3D-фигуры из широкого спектра изображений, снятых в реальном мире, а также изображений, созданных с помощью генеративных моделей», — сказал Хонг. «LRM также является очень практичным решением для последующих приложений, поскольку оно может создать трехмерную форму всего за пять секунд без последующей оптимизации». Успех программы заключается в ее способности использовать базу данных с миллионами параметров изображений и прогнозировать поле нейронного излучения (NeRF). Это способность создавать реалистичные 3D-изображения исключительно на основе 2D-изображений, даже если эти изображения имеют низкое разрешение. NeRF обладает возможностями синтеза изображений, обнаружения объектов и сегментации изображений. 60 лет назад была создана первая компьютерная программа, которая позволяла пользователям создавать простые трехмерные формы и манипулировать ими. Альбом для рисования, разработанный Иваном Сазерлендом в рамках его докторской диссертации. диссертацию в Массачусетском технологическом институте, имел в общей сложности 64 КБ памяти. На протяжении десятилетий 3D-программы стремительно росли благодаря таким программам, как AutoCAD, 3D Studio, SoftImage 3D, RenderMan и Maya. Статья Хонга «LRM: Большая модель реконструкции одного изображения в 3D» была загружена на сервер препринтов arXiv 8 ноября....
Сообщает android-robot.com
Поделиться новостью:
Топ новости часа
- +278,83% (17400 пунктов) за 12 мес по паре GBP/USD — Тест стратегии форекс «ChaSyBi»...
- Чемпионат России. «Спартак» в гостях у «Оренбурга», «Динамо» против «Урала», ЦСКА сыграет с «Зенитом» в воскресенье...
- AMD рассказала о видеокартах следующего поколения. В интервью были затронуты в основном вопросы, связанные с ИИ в RDNA 4...
- Иск против «Барсы», допуск российских фехтовальщиков, задержан метатель банана, грант Навки, баттл Смородской и Заремы и другие новости...
- Hyundai Motor câștigă 2016 Kelley Blue Book Awards ca cea mai bună marcă de costuri de proprietate în ultimii 5 ani...
- Выставка мобильных технологий MWC продемонстрирует новые телефоны, искусственный интеллект и метавселенную...
21:00, 19 Май Мягкая «электронная кожа» генерирует нервные импульсы, которые общаются с мозгом Механорецепторы в коже человека способны ощущать нежный вес бабочки, ощущать жар близлежащего пламени или прохладного напитка, понимать, поднята ли рука в кулаке или в знак мира, и нежным прикосновением подсчитывать пульс близкого человека. трогать....
00:00, 27 Мар Озеро в Танзании мгновенно убивает животных В Танзании есть озеро Натрон, которое мгновенно превращает животных, прикоснувшихся к нему, в камень. Об этом пишет Daily Mail. В водоеме есть бактерии, которые придают ему кроваво-красный оттенок и являются одними из немногих организмов, способных ...
21:00, 22 Окт Роскачество: сальмонелла мгновенно погибает при кипячении Кроме этого, есть ещё два варианта температуры, способные устранить этого вредителя здоровью. А вот низкие бактерия-палочка очень даже хорошо переносит, при 40 градусах она ещё и размножается. И вообще сальмонелла достаточно стойкая — до 3 месяцев ж...
07:33, 30 Май Модель Visualizer: улучшение визуализации данных Визуализация данных является важным аспектом понимания и интерпретации сложной информации. Это позволяет нам представлять данные в визуальных форматах, таких как диаграммы, графики и диаграммы, что облегчает идентификацию закономерностей, тенденций ...
05:00, 16 Окт Названа самая дорогая модель Peugeot В США на аукцион RM Sotheby's выставили очень редкую модель Peugeot 402 Darl’mat Special Coupe 1938 года выпуска. Это авангардный спорткар, который планируют продать примерно за 1,5 миллиона долларов, что является рекордом для автомобилей французско...
04:00, 15 Май Meta представила новую модель искусственного интеллекта Компания Meta Platforms представила новую модель искусственного интеллекта с открытым кодом под названием ImageBind, сообщает издание Verge. Новая модель ИИ связывает несколько форм данных, таких как аудио, текст, визуальные данные, данные о глубине...
09:00, 17 Апр Учёные из стволовых клеток собрали модель эмбриона человека Журнал Nature описал новое исследование ранней стадии развития плода. Коллектив биологов решился на новый эксперимент, который должен раскрыть белые пятна в знаниях о развитии плода. Из стволовых клеток учёные собрали модель эмбриона человека сроком...
09:00, 08 Июн "Моя жизнь похожа на ад". Модель Софию Мартынову преследует бывший возлюбленный Модель София Мартынова, которая работает с такими брендами, как Coach, Marc Jacobs, Fendi, Jil Sander, Dolce & Gabbana, Loewe, Giambattista Valli, Alexander McQueen и Miu Miu, а в 2020 году стала лицом парфюма Dior, рассказала о преследовании со сто...
14:00, 20 Июл Компания LG представила робота-официанта LG CLOi ServeBot 1 (модель LDLTR30), созданного для объектов сферы обслуживания Компания LG Electronics (LG) представила свой новейший LG CLOi ServeBot (модель LDLTR30), созданного для объектов сферы обслуживания (включая пункты общественного питания). LG CLOi ServeBot со стабильной системой навигации и автономного передвижения...
11:00, 10 Июн Видео: Volvo XC40 Recharge неожиданно превзошла модель C40 Recharge на «лосином тесте» Для расширения модельной линейки автопроизводители часто одну и ту же модель выводят на рынок с двумя типами кузова — например, стандартный кроссовер за счёт нового кузова превращается в купе-кроссовер. Обычно купеобразную версию считают более спорт...