Eenvoudig een 3D-model bijwerken, precies zoals jij het wil

Xander

Vervaecke

Voorbeelden 3d modellen uit de gebruiker studie

Deze AI-tool laat mensen zonder enige ervaring een bestaand 3D-model gericht bijwerken: je verandert precies het stukje dat je wil, en de rest van het model blijft exact zoals het was. Net dat laatste is tot op heden wat moeilijker voor bestaande tools. Gebruikers melden: "Het gaf me de mogelijkheid om écht tot in detail mijn verbeelding te volgen" en "Het vult mijn creatieve tekortkomingen goed aan en je kan alles aanpassen". Alle veertien testpersonen wilden het achteraf opnieuw gebruiken.

Stel je voor: je hebt eindelijk het perfecte 3D-model voor je game of 3D-print, op één detail na. Je wilt het een zwembroek geven. In de meeste programma's heb je dan twee opties. Of je leert maandenlang werken met een tool als Blender, vol knoppen en menu's waar zelfs een simpel bolletje een opgave wordt. Of je laat een AI er een nieuw model van maken en hoopt dat het deze keer wél klopt, want bijsturen kan niet. Je gooit telkens alles weg en begint van nul.

Precies die frustratie was het startpunt voor mijn masterproef. Ik wilde voor een eigen project een 3D-model maken, raakte met Blender nooit vertrouwd en botste bij AI-generatoren op het omgekeerde probleem: makkelijk, maar te weinig controle. Kwam het resultaat dichtbij maar niet helemaal? Dan was de enige oplossing de opdracht herformuleren en hopen dat het er nu wel juist uit ging komen.

Mijn onderzoek stelt daarom één centrale vraag: kun je generatieve AI gebruiken om een bestaand 3D-model in gecontroleerde stappen bij te werken, zonder de delen kwijt te raken die je net wél wou houden?

Voorbeeld voor, prompt en na

Teken hoe jij het je inbeeld

Het systeem dat ik bouwde werkt als een soort lopende band. Je uploadt je model, draait het naar het juiste aanzicht en tekent er met een felroze penseel overheen wat er moet veranderen: bijtekenen wat erbij moet, wegstrepen wat weg mag. Daarna schrijf je in één zin wat je wil. Een taalmodel leest die zin, stelt zo nodig één vraag, en herschrijft hem tot iets duidelijkers. Veelzeggend: in de test koos elke deelnemer voor de herschreven versie boven hun eigen zin.

Op basis daarvan toont het systeem vier voorstellen als afbeelding. Zo zie je meteen ongeveer hoe het eindresultaat eruit zal zien, nog vóór er ook maar iets in 3D gebeurt. Je kiest het beste voorstel, of past eentje exact aan naar hoe jij het wil, en pas dan wordt er een echt 3D-model van gemaakt.

Alleen veranderen wat moet

Hier zit het grootste probleem. Dat nieuwe 3D-model lijkt op je wens, maar is niet exact hoe het origineel was: andere vorm, andere proporties, andere opbouw. Je mannetje wordt onherkenbaar en het kapsel simpelweg “knippen en plakken”, zorgt voor vreemde afwijkingen.

De kern van mijn werk is een methode die ik ASMR-3D noem en die dit oplost in drie stappen. Eerst legt ze het nieuwe en het oude model netjes over elkaar. Daarna bepaalt ze automatisch welk stukje je eigenlijk wou wijzigen, door drie aanwijzingen tegen elkaar af te wegen, een beetje als een stemming: verschillende methodes stemmen op welke delen aangepast moeten worden, je moet genoeg stemmen hebben om geselecteerd te worden. Tot slot worden enkel die stukken opnieuw opgebouwd en vakkundig aan elkaar genaaid, terwijl elk ander punt van je model exact op zijn plaats blijft staan. Een dunne overgangszone zorgt ervoor dat de overgang vrijwel onzichtbaar is.

Het verschil is groot. De onveranderde delen bleven ongeveer 27 keer trouwer aan het origineel dan wanneer je een AI het hele model opnieuw laat maken.

Werkt het ook voor wie er niets van kent?

Om dat te testen liet ik veertien mensen ermee werken. Geen van hen had ooit eerder met een 3D-bewerkingsprogramma gewerkt. Iedereen kreeg dezelfde eerste opdracht: vervang het hoofd van een figuurtje door een goblinhoofd. Daarna mochten ze zelf een model kiezen en er om het even wat aan veranderen.

De reacties waren opvallend positief. Op een standaardvragenlijst voor gebruikerservaring scoorde het systeem op vijf van de zes punten in de hoogste categorie, "uitstekend". Alle veertien deelnemers zeiden dat ze het opnieuw zouden gebruiken en zouden aanraden. Ook scoorden ze de kwaliteit van het uiteindelijk gegenereerde 3D-model zeer hoog.

Perfect is het nog niet. Het opnieuw inkleuren van het model gebeurt nu over het hele oppervlak in plaats van enkel op het bewerkte deel en de manier waarop je de selectie bijstuurt, vonden de deelnemers het minst geslaagd. Dat zijn dan ook de eerste dingen die ik zou aanpakken.

Toch laat dit werk iets belangrijks zien. Een 3D-model bijwerken hoeft geen keuze meer te zijn tussen maandenlang Blender leren of alles weggooien en hopen. Je kan tekenen wat je wil, in één zin zeggen wat je bedoelt en de rest van je model gewoon laten staan. De astronaut kan nu dus een zwembroek dragen, zonder dat het helemaal aangepast wordt.

Bibliografie

[Barequet and Sharir, 1995] Barequet, G. and Sharir, M. (1995). Filling gaps in the boundary
of a polyhedron. Computer Aided Geometric Design, 12(2):207–229.
[Besl and McKay, 1992] Besl, P. and McKay, N. D. (1992). A method for registration of 3-d
shapes. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(2):239–256.
[Brack et al., 2023] Brack, M., Schramowski, P., Friedrich, F., Hintersdorf, D., and Kersting,
K. (2023). The stable artist: Steering semantics in diffusion latent space.
[Chen et al., 2023] Chen, D. Z., Siddiqui, Y., Lee, H.-Y., Tulyakov, S., and Nießner, M. (2023).
Text2tex: Text-driven texture synthesis via diffusion models.
[Chen et al., 2026] Chen, W., Chen, W., Li, P., Wang, Q., Jia, X., Zheng, H., Jia, R., Liu,
Y., and Wang, R. (2026). Know3d: Prompting 3d generation with knowledge from visionlanguage
models.
[Chen and Medioni, 1991] Chen, Y. and Medioni, G. (1991). Object modeling by registration
of multiple range images. In Proceedings. 1991 IEEE International Conference on Robotics
and Automation, pages 2724–2729 vol.3.
[Cheng et al., 2023] Cheng, Y.-C., Lee, H.-Y., Tulyakov, S., Schwing, A., and Gui, L. (2023).
Sdfusion: Multimodal 3d shape completion, reconstruction, and generation.
[Chetverikov et al., 2002] Chetverikov, D., Svirko, D., Stepanov, D., and Krsek, P. (2002). The
trimmed iterative closest point algorithm. volume 16, pages 545– 548 vol.3.
[Decatur et al., 2022] Decatur, D., Lang, I., and Hanocka, R. (2022). 3d highlighter: Localizing
regions on 3d shapes via text descriptions.
[Erko¸c et al., 2024] Erko¸c, Z., G¨umeli, C., Wang, C., Nießner, M., Dai, A., Wonka, P., Lee,
H.-Y., and Zhuang, P. (2024). Preditor3d: Fast and precise 3d shape editing.
[Fischler and Bolles, 1981] Fischler, M. A. and Bolles, R. C. (1981). Random sample consensus:
a paradigm for model fitting with applications to image analysis and automated cartography.
Commun. ACM, 24(6):381–395.
[Frank et al., 2020] Frank, J., Eisenhofer, T., Sch¨onherr, L., Fischer, A., Kolossa, D., and Holz,
T. (2020). Leveraging frequency analysis for deep fake image recognition.
[Fu et al., 2023] Fu, R., Zhan, X., Chen, Y., Ritchie, D., and Sridhar, S. (2023). Shapecrafter:
A recursive text-conditioned 3d shape generation model.
[Gao et al., 2026] Gao, K., Gao, Y., He, H., Lu, D., Xu, L., and Li, J. (2026). Neural radiance
fields in 3d vision: A comprehensive review. Computational Visual Media, page 1–55.
[Gao et al., 2024] Gao, R., Deng, K., Yang, G., Yuan, W., and Zhu, J.-Y. (2024). Tactile
dreamfusion: Exploiting tactile sensing for 3d generation.
[Gutflaish et al., 2025] Gutflaish, E., Kachlon, E., Zisman, H., Hacham, T., Sarid, N., Visheratin,
A., Huberman, S., Davidi, G., Bukchin, G., Goldberg, K., and Mokady, R. (2025).
Generating an image from 1,000 words: Enhancing text-to-image with structured captions.
[Haque et al., 2023] Haque, A., Tancik, M., Efros, A. A., Holynski, A., and Kanazawa, A.
(2023). Instruct-nerf2nerf: Editing 3d scenes with instructions.
[Hegazy, 2024] Hegazy, M. (2024). Diversity of thought elicits stronger reasoning capabilities
in multi-agent debate frameworks. ArXiv, abs/2410.12853.
[Hendrikx et al., 2013] Hendrikx, M., Meijer, S., Van Der Velden, J., and Iosup, A. (2013). Procedural
content generation for games: A survey. ACM Trans. Multimedia Comput. Commun.
Appl., 9(1).
[Jiang, 2024] Jiang, C. (2024). A survey on text-to-3d contents generation in the wild.
[Jincheng et al., 2026] Jincheng, J., Wu, Y., Cai, Y., and Liu, L. (2026). Craftmesh: Highfidelity
generative mesh manipulation via poisson seamless fusion.
[Kato et al., 2020] Kato, H., Beker, D., Morariu, M., Ando, T., Matsuoka, T., Kehl, W., and
Gaidon, A. (2020). Differentiable rendering: A survey.
[Li et al., 2025] Li, P., Ma, S., Chen, J., Liu, Y., Zhang, C., Xue, W., Luo, W., Sheffer, A.,
Wang, W., and Guo, Y. (2025). Cmd: Controllable multiview diffusion for 3d editing and
progressive generation.
[Liang et al., 2025] Liang, Z., Sun, J., and Ma, H. (2025). An llm-lvlm driven agent for iterative
and fine-grained image editing.
[Liepa, 2003] Liepa, P. (2003). Filling Holes in Meshes. In Kobbelt, L., Schroeder, P., and
Hoppe, H., editors, Eurographics Symposium on Geometry Processing. The Eurographics
Association.
[Lin et al., 2023] Lin, C.-H., Gao, J., Tang, L., Takikawa, T., Zeng, X., Huang, X., Kreis, K.,
Fidler, S., Liu, M.-Y., and Lin, T.-Y. (2023). Magic3d: High-resolution text-to-3d content
creation.
[Lindenmayer, 1968] Lindenmayer, A. (1968). Mathematical models for cellular interactions in
development i. filaments with one-sided inputs. Journal of Theoretical Biology, 18(3):280–299.
[Liu et al., 2024] Liu, F.-L., Fu, H., Lai, Y.-K., and Gao, L. (2024). Sketchdream: Sketch-based
text-to-3d generation and editing.
[Loper and Black, 2014] Loper, M. M. and Black, M. J. (2014). Opendr: An approximate
differentiable renderer. In Fleet, D., Pajdla, T., Schiele, B., and Tuytelaars, T., editors,
Computer Vision – ECCV 2014, pages 154–169, Cham. Springer International Publishing.
[Ma et al., 2025] Ma, C., Li, Y., Yan, X., Xu, J., Yang, Y., Wang, C., Zhao, Z., Guo, Y., Chen,
Z., and Guo, C. (2025). P3-sam: Native 3d part segmentation.
[M¨uller et al., 2023] M¨uller, P., Wonka, P., Haegler, S., Ulmer, A., and Van Gool, L. (2023).
Procedural Modeling of Buildings. Association for Computing Machinery, New York, NY,
USA, 1 edition.
[Palfinger, 2022] Palfinger, W. (2022). Continuous remeshing for inverse rendering. Computer
Animation and Virtual Worlds, 33(5):e2101.
[Park et al., 2025] Park, J., Murdivien, S. A., Choi, K., Mun, D., and Um, J. (2025). Generative
3d appearance design: A survey of generation, segmentation and editing by artificial
intelligence. Journal of Computational Design and Engineering, 13(1):1–23.
[Pixune Studios, 2026] Pixune Studios (2026). How much does it cost to make a game? (updated
2026). https://pixune.com/blog/how-much-does-it-cost-to-make-a-game/. Accessed:
2026-05-05.
[Poole et al., 2022] Poole, B., Jain, A., Barron, J. T., and Mildenhall, B. (2022). Dreamfusion:
Text-to-3d using 2d diffusion.
[Prusinkiewicz and Lindenmayer, 1990] Prusinkiewicz, P. and Lindenmayer, A. (1990). The
Algorithmic Beauty of Plants. Springer-Verlag, New York.
[Raj et al., 2023] Raj, A., Kaza, S., Poole, B., Niemeyer, M., Ruiz, N., Mildenhall, B., Zada, S.,
Aberman, K., Rubinstein, M., Barron, J., Li, Y., and Jampani, V. (2023). Dreambooth3d:
Subject-driven text-to-3d generation.
[Rezatofighi et al., 2019] Rezatofighi, H., Tsoi, N., Gwak, J., Sadeghian, A., Reid, I., and
Savarese, S. (2019). Generalized intersection over union: A metric and a loss for bounding
box regression.
[Ritter, 1990] Ritter, J. (1990). An efficient bounding sphere, page 301–303. Academic Press
Professional, Inc., USA.
[Rusu et al., 2009] Rusu, R. B., Blodow, N., and Beetz, M. (2009). Fast point feature histograms
(fpfh) for 3d registration. In 2009 IEEE International Conference on Robotics and
Automation, pages 3212–3217.
[Schrepp et al., 2017a] Schrepp, M., Hinderks, A., and Thomaschewski, J. (2017a). Construction
of a benchmark for the user experience questionnaire (ueq). International Journal of
Interactive Multimedia and Artificial Intelligence, 4:40–44.
[Schrepp et al., 2017b] Schrepp, M., Hinderks, A., and Thomaschewski, J. (2017b). Construction
of a benchmark for the user experience questionnaire (ueq). International Journal of
Interactive Multimedia and Artificial Intelligence, 4(4):40 – 44.
[Shuai et al., 2024] Shuai, X., Ding, H., Ma, X., Tu, R., Jiang, Y.-G., and Tao, D. (2024). A
survey of multimodal-guided image editing with text-to-image diffusion models.
[Sorkine and Alexa, 2007] Sorkine, O. and Alexa, M. (2007). As-rigid-as-possible surface modeling.
In Proceedings of the Fifth Eurographics Symposium on Geometry Processing, SGP ’07,
page 109–116, Goslar, DEU. Eurographics Association.
[Sorkine et al., 2004] Sorkine, O., Cohen-Or, D., Lipman, Y., Alexa, M., R¨ossl, C., and Seidel,
H.-P. (2004). Laplacian surface editing. In Proceedings of the 2004 Eurographics/ACM
SIGGRAPH Symposium on Geometry Processing, SGP ’04, page 175–184, New York, NY,
USA. Association for Computing Machinery.
[Umeyama, 1991] Umeyama, S. (1991). Least-squares estimation of transformation parameters
between two point patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence,
13(4):376–380.
[Voynov et al., 2022] Voynov, A., Aberman, K., and Cohen-Or, D. (2022). Sketch-guided textto-
image diffusion models.
[Wang et al., 2022] Wang, J., Lin, J., Yu, Q., Liu, R., Chen, Y., and Yu, S. X. (2022). 3d shape
reconstruction from free-hand sketches.
[Wang et al., 2023] Wang, P., Liu, Y., Chen, Z., Liu, L., Liu, Z., Komura, T., Theobalt, C., and
Wang, W. (2023). F2-nerf: Fast neural radiance field training with free camera trajectories.
[Yan et al., 2025] Yan, K., Zhang, C., Speierer, S., Cai, G., Zhu, Y., Dong, Z., and Zhao, S.
(2025). Image-space adaptive sampling for fast inverse rendering. In Proceedings of the Special
Interest Group on Computer Graphics and Interactive Techniques Conference Conference
Papers, SIGGRAPH Conference Papers ’25, New York, NY, USA. Association for Computing
Machinery.
[Yang et al., 2022] Yang, B., Gu, S., Zhang, B., Zhang, T., Chen, X., Sun, X., Chen, D., and
Wen, F. (2022). Paint by example: Exemplar-based image editing with diffusion models.
[Yang et al., 2024] Yang, Y., Huang, Y., Guo, Y.-C., Lu, L., Wu, X., Lam, E. Y., Cao, Y.-P.,
and Liu, X. (2024). Sampart3d: Segment any part in 3d objects.
[Zhang et al., 2023] Zhang, L., Rao, A., and Agrawala, M. (2023). Adding conditional control
to text-to-image diffusion models.
[Zhou et al., 2018] Zhou, Q.-Y., Park, J., and Koltun, V. (2018). Open3d: A modern library
for 3d data processing.
[ ¨ Ocal et al., 2024] ¨ Ocal, B. M., Tatarchenko, M., Karaoglu, S., and Gevers, T. (2024).
Sceneteller: Language-to-3d scene generation.

Download scriptie (22.96 MB)

Universiteit of Hogeschool

Universiteit Hasselt

Thesis jaar

2026

Promotor(en) en begeleiders

Nick Michiels, Joren Michels

Thema('s)

Informatica, kennistechnologie en ICT

Kernwoorden

3D,

3D visie,

3D-model,

Artificiële intelligentie,

3D reconstruction