Instruct learning/prompt learning
Reinforcement Learning from Human Feedback
Prompt Engineering from Microsoft
https://learn.microsoft.com/en-us/semantic-kernel/prompt-engineering/
https://zhuanlan.zhihu.com/p/605451419
实现对话模型的第一步就需要依赖SFT(Supervised FineTune),技术上是对GPT-3进行有监督的微调,本质目的是「对数据集进行优化」,用人类喜欢的答案作为训练数据,机器才能生成人类更喜欢的内容。
Supervised FineTune: 靠人工标注
RM:靠人工打分
Proximal Policy Optimization: SFT +RM
How to Train Really Large Models on Many GPUs
https://lilianweng.github.io/posts/2021-09-25-train-large/#:~:text=How%20to%20Train%20Really%20Large%20Models%20on%20Many,to%20push%20the%20limit%20of%20model%20size.%20
Training Parallelism:
Data Parallelism
Model Parallelism
Pipeline Parallelism
Tensor Parallelism:partition the computation for one tensor operation across multiple devices
State of GPT:大神Andrej揭秘OpenAI大模型原理和训练过程
https://mp.weixin.qq.com/s/zmEGzm1cdXupNoqZ65h7yg
超大语言模型LLM发展历程
https://zhuanlan.zhihu.com/p/612181615
GPT-2: 由transformer解码器块构建,并在非常大的文本语料库上进行训练,以预测段落中的下一个单词
T5: 用于回答问题、总结、翻译和分类
语料: 顾名思义就是我们平时所说的文本,带有文字描述性的文本都可以归类于语料
语料预处理方法: 主要包括数据清洗、分词、词性标注(每个词标注正确的词性,即确定每个词是名词、动词、形容词或其他词性的过程)、去停用词等。
数据标注
https://www.v7labs.com/blog/data-labeling-guide#what-is-data-labeling
https://docs.v7labs.com/docs
Conda Commands:
conda info -e: list all envs
conda create -n johnson --clone glm6b_ljz
conda remove -n johnson --all
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
conda config --show channels
conda config --remove channels https://mirrors.tuna.tsinghua.edu.cn
示例
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: true
proxy_servers:
https: http://proxy.huawei.com:8080
virtualenv:
1. pip install virtualenv(if not installed)
2. mkdir -p {virtualPath}
3. cd {virtualPath}
4. virtualenv {virtualName}
5. {virtualPath}/{virtualName}/Scripts/activate.bat
or {virtualPath}/{virtualName}/Scripts/deactivate.bat
Types of evaluations:
1. Metrics
A metric measures the performance of a model on a given dataset.
Examples of metrics include: Accuracy, Exact Match, Mean Intersection over union (IoUO)
2. Comparisons
3. Measurements
LangChain:
https://mp.weixin.qq.com/s/KrWM3cMywMvYUiawRZ94Gg
Build the prompt with RAG
https://learn.deeplearning.ai/building-applications-vector-databases/lesson/3/retrieval-augmented-generation-(rag)
Building Agentic RAG with LlamaIndex
https://www.deeplearning.ai/short-courses/building-agentic-rag-with-llamaindex/
补充参考:
Pip package installing ways:
https://packaging.python.org/en/latest/tutorials/installing-packages/#installing-from-local-archives
CUDA与Pytorch适配版本列表:
https://blog.csdn.net/weixin_44842318/article/details/127492491
快速了解 OpenAI 的 fine-tune 和 Embedding 能力
https://zhuanlan.zhihu.com/p/609359047
python:
https://www.runoob.com/python3/python3-tutorial.html
分享到:
相关推荐
清华大学AI人工智能概论课程列表,高等学校人工智能通识课规划内容 清华大学AI人工智能概论课程 第10章 建筑智能化技术 含习题 共35页 .pptx 清华大学AI人工智能概论课程 第1章 AI时代的起航 含习题 共56页 .pptx ...
清华大学AI人工智能概论课程列表,高等学校人工智能通识课规划内容 清华大学AI人工智能概论课程 第10章 建筑智能化技术 含习题 共35页 .pptx 清华大学AI人工智能概论课程 第1章 AI时代的起航 含习题 共56页 .pptx ...
近几年,随着人工智能的迅速发展,人工智能对各行各业也产生...所以,今天专知小编给大家带来的是Google可解释人工智能白皮书《AI Explainability Whitepaper》,总共27页pdf,主要介绍谷歌的AI平台上的AI的可解释性。
清华大学高级人工智能人才培养课程 AI人工智能 智能系统 课程体系 第1章 智能系统绪论 含习题 共28页.pptx 清华大学高级人工智能人才培养课程 AI人工智能 智能系统 课程体系 第2章 智能感知 含习题 共33页.pptx 清华...
中山大学 超级计算机学院 Ai人工智能课程 AI课程 第1章 关于AI人工智能 About AI 共79页.ppt 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第3章 状态空间搜索的结构与策略 共58页.ppt 中山大学 超级计算机学院 ...
该资源包含人工智能相关的一些资料:人工智能程序设计语言lisp,Prolog,路径寻找算法(A×),NP问题等。
人工智能行业从CHAT-GPT到生成式AI(Generative AI):人工智能新范式,重新定义生产力.pdf
人工智能AI产业链全景图全文共16页,当前为第1页。人工智能AI产业链全景图全文共16页,当前为第1页。人工智能AI产业链全景图 人工智能AI产业链全景图全文共16页,当前为第1页。 人工智能AI产业链全景图全文共16页,...
清华大学AI人工智能概论课程列表,高等学校人工智能通识课规划内容 清华大学AI人工智能概论课程 第10章 建筑智能化技术 含习题 共35页 .pptx 清华大学AI人工智能概论课程 第1章 AI时代的起航 含习题 共56页 .pptx ...
人工智能-从CHAT-GPT到生成式AI(Generative AI):人工智能新范式,重新定义生产力.rar
人工智能工具包 OpenAI
清华大学高级人工智能人才培养课程 AI人工智能 智能系统 课程体系 第1章 智能系统绪论 含习题 共28页.pptx 清华大学高级人工智能人才培养课程 AI人工智能 智能系统 课程体系 第2章 智能感知 含习题 共33页.pptx 清华...
人工智能(AI)与智能医学新专业建设设想.docx人工智能(AI)与智能医学新专业建设设想.docx人工智能(AI)与智能医学新专业建设设想.docx人工智能(AI)与智能医学新专业建设设想.docx人工智能(AI)与智能医学新专业建设设想...
人工智能工具包 OpenAI.7z
AI人工智能:54份行业重磅报告汇总 AI人工智能:54份行业重磅报告汇总
AI+人工智能革命 第一章 目录 Contents AI+人工智能整体结构 第二章 AI+人工智能技术能力 第三章 AI+人工智能解决方案 第四章 AI智能人工智能解决方案全文共50页,当前为第2页。 AI+人工智能革命 1 AI智能人工智能...
一、AI创新融合新趋势 41.1 人工智能正全方位商业化 41.2 AI全面进入机器学习时代 51.3 市场对投资回归理性 81.4 城市逐渐成为AI创新融合应用主战场 131.5 AI支持体系不断发力 211.6 顶层政策倾斜力度持续增加 231.7...
近期人工智能研究公司OpenAI推出的聊天机器人模型CHAT-GPT不断出圈,据 Semafor 援引知情人士报道,微软正商谈以 290 亿美元估值,向 OpenAI 投资 100 亿美元,一切 均指向人工智能模型的新范式“生成式AI模型...
AI人工智能开放平台解决方案共19页.pptx Ai智慧养老及智能家居综合解决方案共67页.pptx AI智能+人脸识别.pptx AI智能+人脸识别场景应用方案.pptx AI智能+人脸识别应用方案.pptx AI智能+人脸识别应用解决方案.pptx AI...
The demand for AI-related professional skills is increasing across virtually every American industrial sector. 7. For the first time in the last decade, year-over-year private in the investment in ...