likes
comments
collection

Android 音视频分离

作者站长头像
站长
· 阅读数 126

一、前言

MediaPlayer作为Android系统中内置的音视频播放组件,经历了无数版本的迭代和优化,功能也想比6.0之前的版本丰富了很多。但仍然避免不了备受争议的问题,作为入门级播放器,他简单易用是显而易见的,但是如果用于定制类型的播放器项目,MediaPlayer的劣势让人无可奈何。这些劣势主要表现如下:

  • 在无法切换音频或者视频Track
  • 无法设置MediaClock进行音画同步干预
  • 无法添加或者裁剪Renderer
  • 无法添加或者裁剪Decoder
  • 数据源接口相当难用,即便是Android 6.0之后的MediaDataSource 对网络流也不友好,多线程访问存在很多问题
  • seek时buffering行为存在不确定性
  • HLS 不支持seek
  • 不支持缓存和中间数据加工机制

当然,上述问题四共性问题了,但更糟的情况是,国内系统厂商用自己实现Player代替了MediaPlayer,会出现新的问题,甚至是某遥遥领先的方案都会出很多问题:

  • 私有的状态码只有厂商自己知道
  • 调用Seek时可能会黑屏、提前结束播放
  • 状态机制混乱,发生error后又走了playbackComplete状态
  • 播放进度抖动,画面正常
  • 音量可能关不掉,想静音都难
  • 不支持AudioEffect 音效,想通过这种方式也无法关闭音量
  • 变速支持不太好,导致播放进度不稳定

二、为什么要分离音视频

我们从前言可知,MediaPlayer无法切换Track,其次可能存在音量关不掉的问题。在一些业务场景中,我们只想让MediaPlayer播放视频,用ffmpeg或者MediaMuxer + MediaCodec 去播放音频,以达到原伴唱切换的目的,因此,我们需要从视频源中🥃音频Track。

当然可能的疑问,为什么不在后端处理,实际上在降本增效的大环境下,这个成本还是有些高的。Video 和 Audio 通常具备多种品质,视频里有如 480P、720P、1080P、2K... 等,而 Video 中有普通音质、middle 音质、HQ 音质等,在目前降本增效的愿景的下,需要考虑到的降低存储成本和传输成本,因此有必要对音频和视频实现动态合成,当然这和本文标题和本文写作目的背离。本文的目的是想实现在手机端实现默认音质且其他音质的方案。

考虑到 ExoPlayer 可以实现切换音质,但对于 MediaPlayer 而言,这个是相当困难的,所有本文重点实质是解决 MediaPlayer 音质切换问题的第一步 —— 音视频分离。

三、原理

在 Android 中,官方提供了 MediaExtrator,虽然相比 ExoPlayer 自行实现的一套方案还是比较鸡肋,但对音视频动态分离,其提供的能力足矣。

MediaPlayer 我们都知道,其 DataSource 不如 ExoPlayer 灵活,此外新接口 MediaDataSource 也不兼容早起版本,所有可以使用也就是使用 Url 实现中间处理过程,具体过程如下:

【数据源】 - 【Proxy】 -> 【MediaPlayer】

具体代理过程中我们不细述,这里我们会在 Proxy 做一些处理,如下面方式

【数据源】 -> 【音视频分离】 -> 【视频 Proxy 】-> MediaPlayer

这部分代码我们不具体处理,这里主要来说音视频分离方式。

  • MediaExtractor 负责分离数据
  • MediaMuxer 负责合成分离后的数据

这里最大的问题是为什么要合成分离后的数据?

实际上 MediaExtractor 是解封装了数据,但封装信息和数据是单独存储的么,因此需要将封装信息重新和数据整合。

四、核心代码

public class MediaTrackExtractor {

    private static final String TAG = "MediaTrackExtractor";

    public static void extractAudioOrVideo(String mimeHead, String pathOrUrl, String outputPath) {
        MediaExtractor mediaExtractor = new MediaExtractor();
        MediaMuxer mediaMuxer = null;
        try {
            // 设置视频源
            mediaExtractor.setDataSource(pathOrUrl);
            // 轨道索引
            int audioIndex = -1;
            // 视频轨道格式信息
            MediaFormat mediaFormat = null;
            // 数据源的轨道数
            int trackCount = mediaExtractor.getTrackCount();
            for (int i = 0; i < trackCount; i++) {
                MediaFormat format = mediaExtractor.getTrackFormat(i);
                String mimeType = format.getString(MediaFormat.KEY_MIME);
                if (mimeType.startsWith(mimeHead + "/")) {
                    audioIndex = i;
                    mediaFormat = format;
                    break;
                }
            }
            // 切换到想要的轨道
            mediaExtractor.selectTrack(audioIndex);
            File outFile = new File(outputPath);
            if (outFile.exists()) {
                outFile.delete();
            }

            mediaMuxer = new MediaMuxer(outFile.getAbsolutePath(), MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4);
            //这里MUXER_OUTPUT_MPEG_4 是因为大部分视频是mpeg4封装,具体情况下按具体传入不同类型

            int trackIndex = mediaMuxer.addTrack(mediaFormat);


            int maxInputSize = mediaFormat.getInteger(MediaFormat.KEY_MAX_INPUT_SIZE);
            ByteBuffer byteBuffer = ByteBuffer.allocate(maxInputSize);
            MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo();
            mediaMuxer.start();

            while (true) {
                // 将样本数据存储到字节缓存区
                int readSampleSize = mediaExtractor.readSampleData(byteBuffer, 0);  //采样数据
                // 如果没有可获取的样本,退出循环
                if (readSampleSize < 0) {
                    mediaExtractor.unselectTrack(audioIndex);
                    break;
                }
                bufferInfo.size = readSampleSize;
                bufferInfo.offset = 0;
                bufferInfo.presentationTimeUs = mediaExtractor.getSampleTime();
                int sampleFlags = mediaExtractor.getSampleFlags();

                if (sampleFlags == MediaExtractor.SAMPLE_FLAG_SYNC) {
                    bufferInfo.flags = MediaCodec.BUFFER_FLAG_KEY_FRAME;  //关键帧
                } else if (sampleFlags == MediaExtractor.SAMPLE_FLAG_PARTIAL_FRAME) {
                    bufferInfo.flags = MediaCodec.BUFFER_FLAG_PARTIAL_FRAME; // 非关键帧
                } else if (sampleFlags == MediaExtractor.SAMPLE_FLAG_ENCRYPTED) {
                    bufferInfo.flags = MediaCodec.BUFFER_FLAG_CODEC_CONFIG; //存在内部封装
                }
                mediaMuxer.writeSampleData(trackIndex, byteBuffer, bufferInfo);
                // 读取下一帧数据
                mediaExtractor.advance();
            }
            Log.i(TAG, "分离" + mimeHead + "完成");
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (mediaMuxer != null) {
                mediaMuxer.stop();
                mediaMuxer.release();
            }
            mediaExtractor.release();
        }
    }


}

五、简单实用方式

我们以离线方式为例子,使用如下

File dir = new File(mMp4FilePath).getParentFile(); 
Log.d(TAG,"开始提取"); 
File videoOutputFile = new File(dir,"sample_oceans_extrator.mp4"); 
File audioOutputFile = new File(dir,"sample_oceans_extrator.mp3"); 
MediaTrackExtractor.extractAudioOrVideo("video",mMp4FilePath,videoOutputFile.getAbsolutePath());
 MediaTrackExtractor.extractAudioOrVideo("audio",mMp4FilePath,audioOutputFile.getAbsolutePath()); 
Log.d(TAG,"提取完成");

如果在线资源该如何处理呢?

首先,MediaExtractor 是支持在线资源的,我们仍然可以利用这个机制,实现在线流的分离,不过说到这里,MediaMuxer也存在一定的缺陷,不支持获取编码后的buffer,这点我们可以选用ffmpeg中的相关组件进行替换,或者更简便的方法,对seek操作允许长时间等待缓存,也能满足需要,毕竟MediaPlayer、MediaExtractor、MediaMuxer 也就只能做简单的事,不能要求太高。