- 短视频文案创作零基础入门:创意解析+内容策划+写作技巧
- 闫春红
- 5178字
- 2025-04-21 21:02:52
1.2 短视频文案入门:从业余到专业
不论长视频还是短视频,它们的创作都包括前期策划、中期拍摄、后期制作、推广运营等多个环节。对长视频来说,文案的需求主要集中在前期策划和脚本创作两个环节;对于短视频特别是小视频来说,文案除了涉及策划和脚本,还要考虑封面设计、字幕排版、推广话术等多个方面。虽短,其特性却更加突出,也更注重锤炼作者的文案基本功。
正如每门文艺都有其特殊创作规律,短视频也有自己独特的创作要点,它既和长视频有相通之处,也有尊重时代潮流的独到之处,这些差异在文案上更加明显。用简单而通俗的话来说,长视频讲究“娓娓道来”“从头说起”,而短视频则侧重于“核心突出”“信息爆炸”。因此,如何让语言更具冲击力,如何在有限的时间内容纳更多的信息量,如何才能具有广泛而持久的传播力,这是短视频文案需要解决的问题和需要承担的功能。
有初学者想跨界从事短视频行业,往往会对视频业的团队创作和复杂模式望而却步。俗话说:隔行如隔山。但其实只要你拿下几个“山头”,创作就会一马平川。这几个“山头”也并不高不可攀,本节将以通俗易懂的方式,将短视频创作尤其是文案创作的几个关键常识进行介绍,帮助大家在短时间内消化理解一个专业的门类。
1.2.1 短视频文案的种类和基本写法
短视频文案涉及多个方面,本书将与创意有关的文字统一纳入探讨范围,对脚本进行重点分析。
(1)策划文案
策划的目的有两个,一个是用于讨论和确定短视频创作路线,二是向目标客户介绍创意创作构思。
策划文案可以涵盖以下方面:创作理念、主题阐述、调性风格、形式解析/框架结构、创意解读等。当然,形式并不是固定的,可以根据需要进行灵活组合、增删。可参见《从零开始学视频文案创作》(化学工业出版社)第1章。
关于××的策划方案
首先介绍本片的用意用途,以及与客户一致达成的创作目标。
一、创作理念
根据背景材料提出创作想法和创作思路,指明创作方向。当有独特创意的时候,在这里解释原因和创意来源。
二、主题阐述
对内容材料进行解读,确立并提出本片核心主题,尽可能用一句话或一个短语来指代主题。
三、调性风格
阐释作品可能会采用的创意风格和整个作品的基调,让客户等读者明白作品的类型特点。
四、形式解析/框架结构
对作品的主线辅线、形式结构进行解读,必要时用关键词、小标题辅助点明。
五、创意解读
在对形式内容有充分了解的情况下,深入强调和解读独到的见解和创意。
(2)文学脚本
脚本又分为文学脚本和分镜头脚本两类。一般来讲,文学脚本主要用于初步阅读,分镜头脚本则是导演工作台本,用于指导创作团队的分步工作。因为短视频较短、流程简化,同时也结合每个创作者不同的喜好,每个团队/个人都有不同的格式习惯,不必拘泥于固定的格式。
首先介绍文学脚本的基本模板:
《××》文学脚本
【画面】……
(大体描述本段落出现的画面,以备摄像拍摄或者查找相关资料。)
【解说】……
(配音、旁白的具体内容。)
【同期】……
(在现场同步拾取的画面和声音,比如现场人物的对话、环境音等。)
【采访】……
(指有设计的人物采访内容。)
【字幕】……
(屏幕上叠加或代替画面出现的汉字,可以与解说并行,也可以单独设计。)
其他辅助条目:
【音乐】……
(用哪种音乐,渐强还是渐弱,节奏如何。)
【音效】……
(除解说、音乐、同期声之外的其他效果音。)
【特效】……
(用于指导后期制作时采用的特殊效果,多见于段落衔接和画面处理。)
以上各条目并非一定要全部出现,可结合实际情况和需要进行选择、搭配,在形式上也不必固化。下面分享一个短视频段落,编导和后期制作人员分别使用了不同的标识方法。
编导文案
【画面】日照市的阳光、碧海、金沙滩等标志性景物;幸福和谐的生活图景;原始陶文;绿茶;丁肇中;日出。
【字幕/解说】这是一个被太阳眷顾的幸福之城;“联合国人居奖”城市;中国原始陶文的发掘地;江北最大的绿茶之乡;诺贝尔物理学奖获得者丁肇中的故乡;向阳而立、逐光而行——日照。
【出标题】逐光之城
【画面】与古代文化相关的各类画面。
【解说】日照,一方文化厚土。山海相拥,水网密织,茶稻飘香。这片大自然的富水区,成为得天独厚的文化富集区,龙山文化、太阳文化、东夷文化、尧王文化、太公文化、莒文化在这里迭代交织、推陈出新。
后期制作文案
【字幕/解说】这是一个被太阳眷顾的幸福之城;“联合国人居奖”城市;中国原始陶文的发掘地;江北最大的绿茶之乡;诺贝尔物理学奖获得者丁肇中的故乡;向阳而立、逐光而行——日照。
(镜头:灯塔、海龙湾、天台山、五莲山日出、万平口海岸线、文字特写、绿茶航拍、丁肇中故居、太阳升起延时。)
【出标题】逐光之城(太阳特写,出字。)
【解说】日照,一方文化厚土。(镜头:河山、大字。)
山海相拥,水网密织,茶稻飘香。(镜头:九仙山、河道、茶、稻。)
这片大自然的富水区,成为得天独厚的文化富集区,龙山文化、太阳文化、东夷文化、尧王文化、太公文化、莒文化在这里迭代交织、推陈出新。(远古资料镜头、相关文化镜头。)
从两个文学脚本的比较可以看出,编导的文案偏向于引领阅读,而后期制作人员的文案偏向于拍摄需求、寻找素材,不同的情境可以灵活运用。
(3)分镜头脚本
分镜头脚本一般指导演工作台本,主要作用是指导和规划拍摄以及后期各项工作,严格来说是一种处理方式而非写作方式。
分镜头脚本一般以表格形式呈现,如:

镜号:把预想中的成片画面以镜头为单位一个接一个按顺序排列下来,以阿拉伯数字表示。在简化或较熟悉的拍摄流程中,这个项目也可以粗写为“场景号”,即一个场景作为一组。
解说:即解说词,与画面同时出现的人声旁白。
画面/字幕:以简略语言介绍画面呈现内容,包括字幕、装饰等。
景别:按照拍摄对象在画幅中的大小比例,景别一般有远景、全景、中景、近景、特写等。
拍摄方式:一般指镜头的运动技巧,推、拉、摇、移、跟,及固定镜头或其他特殊处理方式的标注。
时长:本镜头/场景的时间长度。
音乐:使用何种风格音乐,或注明某首音乐的名称。
特效:后期希望用何种特效处理。
备注:其他补充内容或特别提醒内容。
同理,创作者可以根据需要自由设置项目个数和先后顺序。
针对上文案例,分镜头脚本是这样的:

1.2.2 短视频创作的常用基础知识
短视频是视频创作的一类,在拥有自身特点的同时,也符合视频的普适创作规律。本节用浅显易懂的方式分析几个短视频、小视频创作中的基础概念,这些概念和方法也是专业与非专业之别的关键所在。
(1)蒙太奇
蒙太奇是源于电影的一种剪辑手法,原意为构成、装配、组接,指的是不同的镜头组接在一起,往往会产生各个镜头单独存在时所不具有的含义。蒙太奇理论非常丰富,也有很多不同流派和代表性人物,初学者可以从最基本的用法学起。
简单来说,蒙太奇就是让镜头与镜头之间的组接产生1+1=3的效果。电影导演、电影理论家库里肖夫做过一个著名的实验:他给演员莫兹尤辛拍了一个毫无表情的特写镜头,然后分别在这个镜头后面接上3个不同的片段,第一个是一盆汤,第二个是躺着女尸的棺材,第三个是抱着玩具的女孩,然后收集观众们的反馈。据说观众看了第一种组接,认为演员有饥饿的表情,想喝汤;看了第二种组接,观众认为演员的情绪是悲伤;而第三种组接,观众看后感觉演员很愉快。实际上,演员的表情特写是唯一的,也没有预定意义,但是观众却从不同的组接中解读出了演员不同的情绪,这就是有名的“库里肖夫效应”。
为什么会这样?简单来说,是因为人有联想的能力,会自动归因和推演,会有把缺口补全的潜意识。认识到这一点,我们就可以在短视频创作中大有可为。
(2)镜头成组
有的初学者兴致勃勃拍摄了一堆素材,将看好的镜头组接在一起,却显得很凌乱,为什么?除了主线要清晰,还要用好一个方法:镜头成组。
镜头成组,就是用一组镜头表达一个意思,这组镜头或者是在同一个场景所拍,或者是有相互关联,组接在一起共同起作用。比如,要表现一个大剧院,一个镜头是场上的表演,另一个镜头最好有场下观众的掌声或观众认真观看的情形,这两个镜头就成组了。又比如,表现一个武术表演,要有全景、近景,也要有特写、运动镜头,这些组合在一起才能展现武术的精彩和动感。所谓“独木不成林”,单一的镜头很难支撑起完整的表达,学会用不同景别、不同角度、不同主体的镜头组合应用,将会让视频看起来表达充分、含义丰富。
(3)声画对位
声画对位原本也是影视创作中的一种声画关系,属于蒙太奇的一种,指的是画面和声音分别表达内容,它们看似不相关,但配合在一起却产生奇妙的融合作用。
如有一个搞笑小视频,背景是一只狗的饭盆被过路汽车不小心压坏了,视频就是狗盯着镜头这个简单的画面,然后配上《oh!no!》这首抖音“神曲”(1),看起来狗相当不高兴甚至像是在威胁当事人,一个强烈的戏剧效果就出现了。
(4)解说与画面要互相补充、不要重叠
这一点也是视频创作中的常识性问题,指的是画面与声音尤其是解说,二者之间是互补的关系,不是重叠的关系,画面已经讲了的,解说就不要再重复,反之亦然。
比如,春天来了,有人拍了一条关于春天的短视频。画面上有花,解说就配“花开了”;画面上出现蓝天,就解说“蓝天白云”……这样的解说属于“无效解说”,为什么呢?因为画面已经清清楚楚讲明白了,解说还要多此一举,这样就会显得累赘、啰嗦、不专业。正确的做法应该是在优美的画面上进行提升性的、发散性的解说,让观众用蒙太奇心理领会到画面之外的更高立意或者情感。如果实在没的说不要硬说,用音乐铺垫,只要画面也就够了。
(5)景别差异化组合
景别是指拍摄主体在画面中所呈现的范围大小。以拍摄人物为例:全身都拍到,叫作全景;画面展示膝盖以上,叫作中景;画面展示肩部以上,叫作近景;画面展示身体某部位叫作特写;如果把人物和周围的环境都拍上,就叫作远景;再远一点,就可以叫作大远景。
两个镜头组接时,要注意相似景别不要组合在一起,相差太大的景别也不要组合在一起。比如:一个中景人物,紧接着再来一个中景人物,就会有“跳跃”感;一个航拍如果接一个大特写,人的视觉会有不适感。正确的做法应该是组接有差异的景别,但不要把两极镜头即差异很大的镜头组合在一起。
(6)动接动,静接静
有初学者在剪辑时,前一个是速度较快的运动镜头,紧接着下一个就是固定镜头,快慢之间、动静之间,让人有一种“刹不住车”的错觉。正确的做法应该是:运动的镜头接运动的镜头,静止的镜头接静止的镜头。如果从动到静,或者从静到动怎么办?利用运动镜头的起幅、落幅稳定下来,或者利用淡入淡出、叠画等特技功能弱化动静结合的不适感。
以上概念中,有些多用于剪辑,有些多用于拍摄,但无论哪方面,最初都要体现在脚本文案中,是文案写作的基础用法。明白这些概念背后的原理,学会这些手法,等于一脚迈进了专业短视频创作的大门,在创作中就不会摸不着头脑。
1.2.3 小视频文案重点在字幕编排
小视频与短视频虽然没有严格的界线划分,但短至10秒以内的小视频更注重画面上的字幕体现。

大一新生“连滚带爬”地铁救人
《人民日报》抖音客户端发布的一条14秒的社会暖新闻,其中共6个画面,表现了鲜明的小视频特点。
(1)文案主体清晰、醒目、简洁
画面中主体字幕出现在画面上方,字体较大、清晰醒目,一般1~2行文案作为主要内容,每一行在10个字左右。字幕不遮挡画面主体,且与画面形成互补关系。
(2)文案网感要强
什么是网感?从字面意思上说,网感就是网络感觉,大概来讲,就是指对网络很熟悉,对热词、热梗、网络暗语了然于胸,对网络发展方向和生存环境等有较敏锐的洞察力。感觉是很难精准描摹的一种东西,但是当大家都心照不宣地共同认定一种感觉,它就成了网络语言的独有语境。它是年轻人喜欢的语感,口语化、随意性、简洁明了是它的风格。
如视频中,第一幅是出标题的画面,“最帅连滚带爬”大一新生获59800元奖学金,“最帅连滚带爬”是标题的修饰,也是网友对事件主人公做出的评价。在看似调侃戏谑中带有温情认同,这就是网感的一种。
(3)用连续性字幕讲一个简单的故事
这个视频由6个画面构成,6个画面中的5个是带有字幕的,它们连起来是这样一个文案:
“‘最帅连滚带爬’大一新生获59800元奖学金,他就是获赞无数的地铁志愿者余涛宏。为救电梯上摔倒的乘客,他连滚带爬冲了过去,自己却蹭破一大块皮。面对嘉奖他却说:‘受之有愧’‘没什么大不了’。而我们觉得,他值得所有的赞!”[注]
标题字幕点出事件,然后用三幅画面介绍事件经过,一幅画面表达情感。
与此同时,还有一幅画面是主人公的笑脸,没有字幕,为什么选取它?这是因为画面也有叙事功能,一张可爱的笑脸就是主人公的反应,很好地增强了视频代入感。所以,在写文案脚本或构思的时候,这张笑脸也应该在文案脚本之内。
(4)下方推文换一种方式简要介绍
如果说上方主体字幕花了心思和技巧,以期实现更好的观看效果,那么在下方的推文部分就可以更加简洁和朴素,用不一样的方式对事件进行评述和补充。同样要注意,推文也不能和画面互相遮挡。