Spaces:

Daankular
/

MeshForge

Runtime error

App Files Files Community

Daankular commited on 8 days ago

Commit

f06ae6c

verified ·

1 Parent(s): 7b514c3

Upload scripts/texture_i2tex.py with huggingface_hub

Browse files

Files changed (1) hide show

scripts/texture_i2tex.py +120 -0

scripts/texture_i2tex.py ADDED Viewed

	@@ -0,0 +1,120 @@

+import argparse
+import os
+import sys
+import torch
+from torchvision import transforms
+from transformers import AutoModelForImageSegmentation
+from mvadapter.pipelines.pipeline_texture import ModProcessConfig, TexturePipeline
+from mvadapter.utils import make_image_grid
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--device", type=str, default="cuda")
+    parser.add_argument("--variant", type=str, default="sdxl", choices=["sdxl", "sd21"])
+    # I/O
+    parser.add_argument("--mesh", type=str, required=True)
+    parser.add_argument("--image", type=str, required=True)
+    parser.add_argument("--text", type=str, default="high quality")
+    parser.add_argument("--seed", type=int, default=-1)
+    parser.add_argument("--save_dir", type=str, default="./output")
+    parser.add_argument("--save_name", type=str, default="i2tex_sample")
+    # Extra
+    parser.add_argument("--reference_conditioning_scale", type=float, default=1.0)
+    parser.add_argument("--preprocess_mesh", action="store_true")
+    parser.add_argument("--remove_bg", action="store_true")
+    args = parser.parse_args()
+    if args.variant == "sdxl":
+        from .inference_ig2mv_sdxl import prepare_pipeline, remove_bg, run_pipeline
+        base_model = "stabilityai/stable-diffusion-xl-base-1.0"
+        vae_model = "madebyollin/sdxl-vae-fp16-fix"
+        height = width = 768
+        uv_size = 4096
+    elif args.variant == "sd21":
+        from .inference_ig2mv_sd import prepare_pipeline, remove_bg, run_pipeline
+        base_model = "stabilityai/stable-diffusion-2-1-base"
+        vae_model = None
+        height = width = 512
+        uv_size = 2048
+    else:
+        raise ValueError(f"Invalid variant: {args.variant}")
+    device = args.device
+    num_views = 6
+    # Prepare pipelines
+    pipe = prepare_pipeline(
+        base_model=base_model,
+        vae_model=vae_model,
+        unet_model=None,
+        lora_model=None,
+        adapter_path="huanngzh/mv-adapter",
+        scheduler=None,
+        num_views=num_views,
+        device=device,
+        dtype=torch.float16,
+    )
+    if args.remove_bg:
+        birefnet = AutoModelForImageSegmentation.from_pretrained(
+            "ZhengPeng7/BiRefNet", trust_remote_code=True
+        )
+        birefnet.to(args.device)
+        transform_image = transforms.Compose(
+            [
+                transforms.Resize((1024, 1024)),
+                transforms.ToTensor(),
+                transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),
+            ]
+        )
+        remove_bg_fn = lambda x: remove_bg(x, birefnet, transform_image, args.device)
+    else:
+        remove_bg_fn = None
+    texture_pipe = TexturePipeline(
+        upscaler_ckpt_path="./checkpoints/RealESRGAN_x2plus.pth",
+        inpaint_ckpt_path=None,
+        device=device,
+    )
+    print("Pipeline ready.")
+    os.makedirs(args.save_dir, exist_ok=True)
+    # 1. run MV-Adapter to generate multi-view images
+    images, _, _, _ = run_pipeline(
+        pipe,
+        mesh_path=args.mesh,
+        num_views=num_views,
+        text=args.text,
+        image=args.image,
+        height=height,
+        width=width,
+        num_inference_steps=50,
+        guidance_scale=3.0,
+        seed=args.seed,
+        reference_conditioning_scale=args.reference_conditioning_scale,
+        negative_prompt="watermark, ugly, deformed, noisy, blurry, low contrast",
+        device=device,
+        remove_bg_fn=remove_bg_fn,
+    )
+    mv_path = os.path.join(args.save_dir, f"{args.save_name}.png")
+    make_image_grid(images, rows=1).save(mv_path)
+    torch.cuda.empty_cache()
+    # 2. un-project and complete texture
+    out = texture_pipe(
+        mesh_path=args.mesh,
+        save_dir=args.save_dir,
+        save_name=args.save_name,
+        uv_unwarp=True,
+        preprocess_mesh=args.preprocess_mesh,
+        uv_size=uv_size,
+        rgb_path=mv_path,
+        rgb_process_config=ModProcessConfig(view_upscale=True, inpaint_mode="uv"),
+        camera_azimuth_deg=[x - 90 for x in [0, 90, 180, 270, 180, 180]],
+    )
+    print(f"Output saved to {out.shaded_model_save_path}")