發表文章

從 HumanNeRF 到 PersonNeRF若你想挑戰 Google 等級的 PersonNeRF(處理不同時間拍攝的照片)

  從 HumanNeRF 到 PersonNeRF若你想挑戰 Google 等級的 PersonNeRF(處理不同時間拍攝的照片) 要復現翁仲毅(Chung-Yi Weng)的研究,最理想的起點是從他的 HumanNeRF 開始,因為這是他後續在 Google 研發許多應用的核心底層技術。 以下是從技術論文角度進行復現的步驟建議與關鍵組件: 1. 取得原始碼與環境準備他大多數的研究都有在 GitHub 上開源。核心專案: HumanNeRF GitHub Repo開發環境:硬體: 建議至少需要一張 24GB 顯存 (VRAM) 的 GPU(如 RTX 3090 或 4090),因為神經渲染對記憶體要求很高。 軟體: PyTorch 是主要的開發框架。 2. 核心算法的三大復現重點若要自行實作或修改模型,需關注以下三個關鍵模塊:Canonical Space (標準空間) 建模:不要直接在動作影像中訓練,而是要建立一個「T-Pose」的靜態 NeRF 模型。 這讓神經網路能學習到穩定的外觀特徵(如皮膚紋理),而不受動作干擾。Motion Field (動作場) 與 SMPL 模型:利用 SMPL (人體參數化模型) 作為先驗知識。復現時需要結合運動估計算法,計算每一幀到標準空間的 Backward Warping (反向扭曲),這部分通常使用 MLP 來預測偏移量 (Offsets)。Non-rigid Refinement (非剛性微調):這是論文中最精妙的地方。單純的骨架運動無法處理衣服的飄動,因此需要一個額外的微調層來處理這些細節。 3. 資料集準備 (Dataset)復現這類模型最難的部分往往是資料處理。ZJU-MoCap: 這是復現 HumanNeRF 最常用的多視角人體動作資料集。自製資料: 若想復現「單視角影片」轉 3D,你需要準備一段繞著人走一圈(或人自轉)的影片,並使用 COLMAP 提取相機位姿,或使用 VIBE/ROMP 提取人體骨架。 4. 關鍵技術指標與調優在實驗過程中,你需要監控以下指標以確保復現方向正確:PSNR / SSIM: 衡量生成的影像質量。 LPIPS: 衡量感知上的真實感(對於人體渲染尤為重要)。 Training Time: 典型的 HumanNeRF 訓練在單張 3090 上可能需要 48-72 小時才能達到論文...

翁仲毅(Chung-Yi Weng ) 在 Google Research 擔任研究科學家 ( Research Scientist )

翁仲毅(Chung-Yi Weng )  在 Google Research 擔任研究科學家 (  Research Scientist ) 翁仲毅(Chung-Yi Weng)博士在 Google Research 主要隸屬於 Augmented Perception 團隊(由 Shahram Izadi 領導),該團隊致力於突破增強實境(AR)與感知技術的邊界。他在 Google 參與的專案核心在於「將靜態或單鏡頭影像轉化為可互動的 3D 體驗」。 在 Google Research 擔任研究科學家期間,最核心的研究貢獻在於 「動態人體神經輻射場」(Dynamic Human NeRF)。 他的研究打破了傳統 NeRF 僅能掃描靜態物體的限制,讓 AI 能夠從一般拍攝的影片中,重建出具有深度、可變換視角且能自由活動的 3D 數位人類。  以下是他在該領域的三項關鍵研究與技術突破: 1. HumanNeRF:將單一影片轉化為 3D 自由視角 這是他在 Google 期間最具影響力的作品之一(發表於 CVPR 2022)。 技術突破: 傳統技術需要幾十台相機圍繞拍攝才能建模,但 HumanNeRF 僅需一段「單鏡頭影片」(例如 YouTube 上的舞動影片),就能生成該人物的完整 3D 模型。 應用場景: 使用者可以「暫停」影片,並像轉動模型一樣 360 度觀看該人物,甚至能看見原本鏡頭沒拍到的背部細節、衣服褶皺與皮膚紋理。  2. PersonNeRF:從散亂照片中進行個性化重建 他在 2023 年推出的 PersonNeRF 進一步提升了技術的實用性。  技術特點: 此項研究針對「日常照片集」進行優化。即便是一個人在不同時間、不同背景下拍的多張照片,系統也能自動過濾背景干擾,精準提取出該個體的 3D 特徵,建立個性化的數位分身。 3. H-NeRF 與動態拓撲處理 在 H-NeRF 研究中,他解決了人體運動時「非剛性變形」的難題。  核心技術: 透過將人體骨架先驗(SMPL 模型)與神經場結合,系統能預測肌肉與服裝在大幅度動作下的自然流動,確保在重建動態人物時不會出現扭曲或斷裂現象。  這些技術目前已被廣泛視為 虛擬實境(VR)、擴增實境(AR) 以及 影視特殊效果 領域的基礎,讓創作者能以極低...

2025 Fun AI Winter Camp

圖片
2025 FUN AI WINTER CAMP 2025 FUN AI WINTER CAMP 想知道 Game AI 是什麼?AI 又是怎麼學會遊戲闖關的?更想實際操作看看建立模型嗎? 透過超強卡司,體驗最好玩的學習方式 2025 Fun AI Winter Camp 營隊期間,在來自敏求智慧運算學院、國立清華大學資訊工程系、國立成功大學資訊工程系、國立陽明交通大學資訊工程系 、國立臺灣科技大學人工智慧跨域科技研究所的強大助教群帶領之下,學員們將學習如何建立 AI 模型,並透過 PAIA (Playful AI Arena)平台,以遊戲化的方式一起益智競賽。 邀請業界與學界猛將分享,學習最新興的科技知識 我們也邀請來自 Google 、Nvidia、 XYZ Robotics、臺灣學術界知名的研究學者們,與我們分享深度學習與人工智慧的相關研究專案! 翁仲毅 Research Scientist at Google KeyNote 1: Embracing Hard Problems, Having Fun with Research 講者簡介 Chung-Yi Weng is currently a Research Scientist at Google fascinated by AI, 3D, and their interaction. Before joining Google, he received his PhD degree from the University of Washington in 2023, where he primarily worked on rendering dynamic humans in 3D from unstructured data. He previously interned at Meta and Google VR/AR, and closely collaborated with Google Research. Beyond his passion for computer science, he is also a die-hard tennis fan and has been very proud of successfully combining his research with hi...

哈利波特場景成真能讓一張照片中的人物走出來(Photo Wake-Up) 

圖片
  哈利波特場景成真能讓一張照片中的人物走出來(Photo Wake-Up)          Welcome !       西雅圖之旅 舊金山之旅 合歡山之美 大雪山谷關 風花雪月           哈利波特場景成真能讓一張照片   中的人物走出來(Photo Wake-Up)   「哈利波特」魔法世界裡,油畫裡的人物能夠甦   醒過來活動兼說話,就連報紙中的新聞人物,全   部都來到你身邊,這情景太虛幻?其實要讓2D平   面圖像像魔法一樣變成3D跳出框框,已經做得到   台灣在美國留學博士生參與的研究團隊,就能   讓畫中人物「活過來」生成3D動畫。   要將2D圖像變成3D立體化,不少學者、廠商都正   在研究成果之一是已經在坊間普及化的「AR」   (虛擬實境擴增實境)圖像。玩過任天堂手遊   《精靈寶可夢GO》(Pokemon Go)應該都體驗過   AR效果,更期待同一廠商下一隻以《哈利波特》   為主題的遊戲,利用AR來場魔法大戰。       翁 盟     2019.05.31                           來自美國麻省理工學院科技(2018.12.21) 報導   那些來自哈利波特的神奇照片?華盛頓...

Chung yi weng

  Chung yi weng   一• Honors & Fellowships 1 • UW Reality Lab Google Fellowship 2022 ~ 2023 2 • UW Reality Lab Research Fellow 2018 ~ 2023 3 • Bob Bandes Best Teaching Assistant Award Honorable Mention 2020 4 • UW Reality Lab Huawei Fellowship 2018 ~ 2019 5 • People’s Choice Award, Allen School Industry Affiliates Research Day 2018 6 • The David Notkin Endowed Graduate Fellowship in Computer Science & Engineering         2015 ~ 2016 7 • Best Paper Award, ACM Multimedia Conference 2006 2006   二• Teaching & Services 1 • TA Lead, CSE457 Computer Graphics 2 • Instructor: Adriana Schulz 3 • Awarded as Best Teaching Assistant (Bob Bandes Award) University of Washington 2020 Spring 4 • TA, CSEP557 Trends in Computer Graphics   Instructor: Brian Curless University of Washington 2019 Spring   三• Reviewers 1 • CVPR, ICCV, SIGGRAPH, SIGGRAPH Asia   四• Press and News [N1] ...