Identyfikatory
Warianty tytułu
Limitations of modern AI-based image generators in the architectural design process
Języki publikacji
Abstrakty
Wraz z wprowadzeniem narzędzi CAD, a potem BIM, architekci zaczęli dostrzegać, że narzędzia, których używają, mają wpływ na ich twórczość. Obecnie architekci zaczynają używać narzędzi AI umożliwiających eksplorację koncepcji projektowych poprzez generowanie obrazów. Te narzędzia, zwane generatorami obrazów AI, generują obrazy na podstawie opisów tekstowych oraz dowolnych wczytanych obrazów, w tym szkiców lub zdjęć. Na rynku dostępne są zarówno narzędzia przeznaczone bezpośrednio do projektowania architektonicznego, jak i narzędzia o charakterze ogólnym, służące do generowania dowolnych obrazów, od fotorealistycznych po malarskie i graficzne. Wszystkie te narzędzia są we wstępnych fazach rozwoju. Artykuł analizuje przydatność i ograniczenia tych narzędzi z perspektywy architekta, biorąc pod uwagę stan technologii na koniec 2023 roku.
With the introduction of CAD and then BIM tools, architects have begun to recognize that the tools they use have an impact on their creations. Today, architects are beginning to use AI tools that enable them to explore design concepts by generating images. These tools, called AI image generators, generate images based on text descriptions and any loaded images, including sketches or photos. There are tools on the market that are designed directly for architectural design, as well as general-purpose tools for generating any image, from photorealistic to painterly and graphic images. All of these tools, are in the preliminary stages of development. This article examines the usefulness and limitations of these tools from an architect's perspective, taking into account the current state of technology at the end of 2023.
Wydawca
Czasopismo
Rocznik
Tom
Strony
28--33
Opis fizyczny
Bibliogr. 12 poz., il., tab.
Twórcy
Bibliografia
- [1] Goodfellow I.J. et. al., (2014), Generative Adversarial Networks, arXiv:1406.2661 [stat.ML].
- [2] Nichol A. et. al., (2021), GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models, arXiv:2112.10741 [cs.CV].
- [3] Rombach R., et. al., (2021), High-Resolution Image Synthesis with Latent Diffusion Models, arXiv:2112.10752 [cs.CV].
- [4] https://www.g2.com/categories/ai-image-generators (dostęp: 20.11.2023).
- [5] Podell D. et. al., (2023) SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis, https://doi.org/10.48550/arXiv.2307.01952.
- [6] Schuhmann Ch. et. al. (2022), LAION-5B: An open large-scale dataset for training next generation image-text models”, arXiv:2210.08402 [cs.CV].
- [7] https://laion.ai/about/ (dostęp: 20.11.2023).
- [8] https://haveibeentrained.com (dostęp: 21.11.2023).
- [9] Gil A., (2005), Szkic, makieta, model komputerowy jako narzędzia pracy twórczej architekta, Praca doktorska, Wydział Architektury Politechnika Śląska, http://repolis.bg.polsl.pl/dlibra/publication/edition/4916.
- [10] https://www.youtube.com/watch?v=D2cybt2lf2Y, How to use AI Rendering in Architecture (dostęp: 21.11.2023).
- [11] Gil A., (2024), Analiza metod pracy projektantów korzystających z generatorów obrazów opartych na sztucznej inteligencji w kreatywnych fazach projektowania architektonicznego, w tym numerze Builder Science, DOI: 10.5604/01.3001.0054.3433
- [12] Raj Sanjay Shah R. et. al., (2023), Human Behavioral Benchmarking: Numeric Magnitude Comparison Effects in Large Language Models, arXiv:2305.10782. [cs.AI].
Uwagi
Artykuł umieszczony w części "Builder Science"
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-3657eb38-429d-4f53-894a-577d1772ab04