在声音处理技术里有一种常用方法就是将声音信号转化成频谱图。比如下面这幅图,就是由一段小提琴演奏转化而来的。
有人会问,转成频谱图后又怎样呢?我不想谈接下来技术上可以做的各种分析,只从人感知信息的方式这个角度来说。
频谱生成其实是将同一种信息的载体给转变了,受众的体验方式也完全变了。不是吗?本来需要听的东西,现在可以看了。
大家想想我们很多时候是不是会用诸如热辣、冰冷、壮丽、轻柔、苦涩、甜蜜这样的词来形容音乐?这不正是把对音乐的
听觉感受类比成其它感官体验吗?
即使这样,我们又能做什么呢?
请看下面这张人脸图:
有点诡异是吧?没错,这是一张地道的频谱图,从一个叫Aphex Twin的音乐家创作的一首曲子中截取出来。不会有人相信
这仅仅是一个巧合吧。
既然声音信息能转换成图像信息,那反过来我们完全可以根据图像来生成声音。需要注意的是,按照频谱生成的规则
(参考http://en.wikipedia.org/wiki/Spectrogram),在频谱图中是没有信号的精确相位信息的,所以无法仅仅根据频谱图来完全还原原始的声音。但是没关系,我们只需要借鉴类似的思路,定义某种将图形数据映射成声音数据的规则就可以通过视觉表达来创作音乐了。这样,普通的音乐爱好者都可以随手涂鸦,然后把他的涂鸦作品“渲染”成音乐片段。是不是够简单?这可大大降低了门槛,让音乐创作平民化了!事实上,上面这幅图对应的音乐就是这样捣鼓出来的,并且有不少艺术家已经用类似的手段来创作作品了。
苹果平台上的一款叫MetaSynth(http://www.uisoftware.com/MetaSynth)的很酷的音乐软件就提供了此功能,它有免费试用版。象我这样没有苹果的穷人可以靠这段介绍(http://uisoftware.com/MetaSynth/FLASH2007/imageSynthIntro.php)来解解馋。MetaSynth会从左到右的“播放”一副图片,每当它遇到一个像素点的时候就会触发一下当前正在使用的乐器,你可以把像素点想象成一个复杂的振荡器(oscillator)。像素点的高度决定了音高(pitch),颜色决定了立体声位置(stero position),亮度决定了音量(volume),而具体的映射参数可以由用户来设置,比如同样一幅图画,像素点的高度值可以按大调音阶(Major Scale)的规律来映射,也可以是小调音阶(Minor Scale)。另外,图像本身还能做各种变化,你可以用各种滤镜去处理它,然后再来听听输出的声音,很多时候你会得到一种奇特的
听觉体验。当然这只是MetaSynth的图像声音转换规则,我们完全可以想象还有许多其它的转换规则,可供探索的空间是无穷无尽的。
Windows用户不要伤心,Coagula(http://hem.passagen.se/rasmuse/Coagula.htm)也能做差不多的事情,尽管远没有MetaSynth那么强大和专业,但它是免费的。操作很简单,好好玩儿吧!