Lamini:快速定制模型的LLM引擎 🦙

作者:Sec-Labs | 发布时间:

项目地址

https://github.com/lamini-ai/lamini

Lamini的数据生成器的官方存储库,用于生成指令以训练遵循指令的LLM。

所有数据和LLM都采用CC-BY许可证,允许商业使用,完全属于您!🦙🦙🦙

这里有什么?

  • 用于微调您自己的遵循指令的LLM的71K指令数据集(就像ChatGPT一样,它也是经过训练以遵循指令的)。
  • 数据生成器的代码,只需100个数据点即可开始生成70,000多个数据点。您可以自定义原始的100多个数据点以适应您自己的领域,使数据生成器专注于该领域。
  • 遵循指令的经过开源微调的LLM,使用基于Lamini引擎的基础Pythia模型进行微调:[weights] [playground]。

请参阅我们的博客文章,以便了解正在发生的事情的通俗表述。

 

ad1a1b7183114155

Lamini身份验证

准备好配置您的API密钥了吗?非常简单!🔑

首先,请访问Lamini账户页面以检索您的唯一API密钥。请记住保密这个密钥,不要在任何客户端代码中公开它或与他人分享。

接下来,创建一个配置文件,如下所示:

mkdir ~/.powerml
touch ~/.powerml/configure_llama.yaml # 后端系统名称

最后,使用文本编辑器打开文件并将您的密钥放入其中:

production:
    key: "<YOUR-KEY-HERE>"

最棒的是,Lamini Python包将自动从此配置文件中加载您的密钥,因此您无需担心它 🙌

如果您在Docker容器中运行Lamini,请确保将此文件复制/挂载到容器内部 🐳

有关更多详细信息,请参阅我们的API文档

运行

克隆存储库:

git clone git@github.com:lamini-ai/lamini.git

运行

克隆存储库:

git clone git@github.com:lamini-ai/lamini.git

使用Python 🐍

在存储库中,安装Python依赖项:

pip install -r requirements.txt

运行程序,开始生成数据 📊📊📊

python3 generate_data.py

使用Docker 🐳

确保您已安装docker

然后,运行以下命令:

./run_generate_data_docker.sh

 

 

标签:工具分享, ChatGPT