Spaces:

airsltd
/

LiquidAI_hf

Sleeping

LiquidAI_hf / start-lfm25-server.sh

OpenCode Deployer

update

5fd9c8d 4 months ago

1.66 kB

	#!/bin/bash

	# LFM2.5-1.2B-Thinking-GGUF 部署脚本
	# 使用 llama.cpp 启动 HTTP API 服务器

	set -e

	# 配置变量
	MODEL_FILE="LFM2.5-1.2B-Thinking-Q4_K_M.gguf"
	HOST="0.0.0.0"
	PORT="7860"
	CTX_SIZE="4096"
	THREADS="-1" # 自动检测CPU核心数
	TEMPERATURE="0.7"
	PREDICT_TOKENS="2048"

	# 检查模型文件是否存在
	if [ ! -f "$MODEL_FILE" ]; then
	echo "❌ 错误: 模型文件 $MODEL_FILE 不存在"
	echo "正在尝试下载模型文件..."

	# 尝试下载模型
	echo "📥 下载 LFM2.5-1.2B-Thinking-Q4_K_M.gguf (731MB)..."
	if curl -L -o "$MODEL_FILE" \
	"https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking-GGUF/resolve/main/LFM2.5-1.2B-Thinking-Q4_K_M.gguf" \
	--connect-timeout 60 \
	--max-time 300; then
	echo "✅ 模型下载完成"
	else
	echo "❌ 模型下载失败，请手动下载后重试"
	echo "手动下载命令:"
	echo "curl -L -o '$MODEL_FILE' 'https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking-GGUF/resolve/main/LFM2.5-1.2B-Thinking-Q4_K_M.gguf'"
	exit 1
	fi
	fi

	echo "🚀 启动 LFM2.5-1.2B-Thinking HTTP 服务器..."
	echo "📁 模型文件: $MODEL_FILE"
	echo "🌐 服务地址: http://$HOST:$PORT"
	echo "💬 API 端点: http://$HOST:$PORT/v1/chat/completions"
	echo ""

	# 启动服务器
	exec llama-server \
	--model "$MODEL_FILE" \
	--host "$HOST" \
	--port "$PORT" \
	--ctx-size "$CTX_SIZE" \
	--threads "$THREADS" \
	--temp "$TEMPERATURE" \
	--n-predict "$PREDICT_TOKENS" \
	--log-disable \
	--verbose-prompt \
	--api-key "lfm25-api-key"

	echo "服务器已启动，按 Ctrl+C 停止服务"