Source code for apkutils.axml.chunk

from struct import pack, unpack

# NS_ANDROID_URI = 'http://schemas.android.com/apk/res/android'

# AXML FORMAT ########################################
# Translated from
# http://code.google.com/p/android4me/source/browse/src/android/content/res/AXmlResourceParser.java

UTF8_FLAG = 0x00000100
CHUNK_STRINGPOOL_TYPE = 0x001C0001
CHUNK_NULL_TYPE = 0x00000000


[docs]class StringPoolChunk(object):
    '''
    解析String Pool Chunk
    '''

    def __init__(self, buff):
        self.size_of_buff = buff.size()
        self.start = buff.get_idx()
        self._cache = {}
        self.header_size, self.header = self.skipNullPadding(buff)

        # 块大小
        self.chunkSize = unpack('<i', buff.read(4))[0]
        # 字符串数
        self.stringCount = unpack('<i', buff.read(4))[0]
        # style 数
        self.styleCount = unpack('<i', buff.read(4))[0]

        # 字符串格式标记
        self.flags = unpack('<i', buff.read(4))[0]
        # 字符串的格式有两种，一种是16bit，另外一种是UTF8
        self.m_isUTF8 = (self.flags & UTF8_FLAG) != 0

        # 字符串起始位置
        self.stringsStart = unpack('<i', buff.read(4))[0]

        # 注意：
        # 1. 如果解析的是清单，那么这个值肯定是为空的。
        # 2. 该值不可能大于小于文件的大小（开发者通常用来对抗解析工具）
        self.stylesStart = unpack('<i', buff.read(4))[0]
        if self.stylesStart > buff.size():
            self.stylesStart = 0

        # 字符串偏移数组
        self.m_stringIndices = []
        # style 偏移数组
        self.m_styleIndices = []
        # 字符串池
        self.m_charbuff = ""
        # style pan 池
        self.m_styles = []

        for _ in range(0, self.stringCount):
            tmp = buff.read(4)
            self.m_stringIndices.append(unpack('<i', tmp)[0])

        for _ in range(0, self.styleCount):
            tmp = buff.read(4)
            self.m_styleIndices.append(unpack('<i', tmp)[0])

        # 4字节对齐
        size = self.chunkSize - self.stringsStart
        if self.stylesStart != 0:
            size = self.stylesStart - self.stringsStart

        # 字符串池
        self.m_charbuff = buff.read(size)

        if self.stylesStart != 0:
            size = self.chunkSize - self.stylesStart

            for _ in range(0, int(size / 4) - 1):
                tmp = buff.read(4)
                self.m_styles.append(unpack('<i', tmp)[0])

[docs]    def skipNullPadding(self, buff):
        '''
        不断地寻找 CHUNK_STRINGPOOL_TYPE，目前暂时没有遇到这种样本。
        '''
        def readNext(buff, first_run=True):
            datas = unpack('<i', buff.read(4))
            header = datas[0]

            if header == CHUNK_NULL_TYPE and first_run:
                print("Skipping null padding in StringPoolChunk header")
                header = readNext(buff, first_run=False)
            elif header != CHUNK_STRINGPOOL_TYPE:
                print("Invalid StringPoolChunk header")

            return header

        header = readNext(buff)
        return header >> 8, header & 0xFF

[docs]    def getString(self, idx):
        if idx in self._cache:
            return self._cache[idx]

        if idx < 0 or not self.m_stringIndices or idx >= len(
                self.m_stringIndices):
            return ""

        offset = self.m_stringIndices[idx]

        if self.m_isUTF8:
            self._cache[idx] = self.decode8(offset)
        else:
            self._cache[idx] = self.decode16(offset)

        return self._cache[idx]

[docs]    def getStyle(self, idx):
        return self.m_styles[idx]

[docs]    def decode8(self, offset):
        str_len, skip = self.decodeLength(offset, 1)
        offset += skip

        encoded_bytes, skip = self.decodeLength(offset, 1)
        offset += skip

        data = self.m_charbuff[offset: offset + encoded_bytes]

        return self.decode_bytes(data, 'utf-8', str_len)

[docs]    def decode16(self, offset):
        str_len, skip = self.decodeLength(offset, 2)
        offset += skip

        encoded_bytes = str_len * 2

        data = self.m_charbuff[offset: offset + encoded_bytes]

        return self.decode_bytes(data, 'utf-16', str_len)

[docs]    def decode_bytes(self, data, encoding, str_len):
        string = data.decode(encoding, 'replace')
        if len(string) != str_len:
            # raise Exception("invalid decoded string length")
            return string + '.invalid_str_len'
        return string

[docs]    def decodeLength(self, offset, sizeof_char):
        length = self.m_charbuff[offset]

        sizeof_2chars = sizeof_char << 1
        fmt_chr = 'B' if sizeof_char == 1 else 'H'
        fmt = "<2" + fmt_chr

        length1, length2 = unpack(
            fmt, self.m_charbuff[offset:(offset + sizeof_2chars)])

        highbit = 0x80 << (8 * (sizeof_char - 1))

        if (length & highbit) != 0:
            return ((length1 & ~highbit) << (8 * sizeof_char)) | length2, sizeof_2chars
        return length1, sizeof_char

[docs]    def show(self, flag=False):
        print("String Pool Chunk:")
        print(" - start:", self.start)
        print(" - header Size:", self.header_size)
        print(" - chunkSize:", self.chunkSize)
        print(" - stringCount:", self.stringCount)
        print(" - styleCount:", self.styleCount)
        print(" - stringsStart:", self.stringsStart)
        print(" - stylesStart:", self.stylesStart)
        print(" - flags:", self.flags)
        print(" - size_of_buff:", self.size_of_buff)
        if not flag:
            return
        for i in range(0, len(self.m_stringIndices)):
            print((i, repr(self.getString(i))))


CHUNK_RESOURCEIDS_TYPE = 0x00080180


[docs]class ResourceIDChunk(object):
    pass


[docs]class SV(object):

    def __init__(self, size, buff):
        self.__size = size
        self.__value = unpack(self.__size, buff)[0]

    def _get(self):
        return pack(self.__size, self.__value)

    def __str__(self):
        return "0x%x" % self.__value

    def __int__(self):
        return self.__value

[docs]    def get_value_buff(self):
        return self._get()

[docs]    def get_value(self):
        return self.__value

[docs]    def set_value(self, attr):
        self.__value = attr


[docs]class BuffHandle(object):

    def __init__(self, buff):
        self.__buff = buff
        self.__idx = 0

[docs]    def size(self):
        return len(self.__buff)

[docs]    def set_idx(self, idx):
        self.__idx = idx

[docs]    def get_idx(self):
        return self.__idx

[docs]    def readNullString(self, size):
        data = self.read(size)
        return data

[docs]    def read_b(self, size):
        return self.__buff[self.__idx:self.__idx + size]

[docs]    def read_at(self, offset, size):
        return self.__buff[offset:offset + size]

[docs]    def read(self, size):
        if isinstance(size, SV):
            size = size.value

        buff = self.__buff[self.__idx:self.__idx + size]
        self.__idx += size

        return buff

[docs]    def end(self):
        return self.__idx == len(self.__buff)


# ATTRIBUTE_IX_NAMESPACE_URI = 0
# ATTRIBUTE_IX_NAME = 1
# ATTRIBUTE_IX_VALUE_STRING = 2
# ATTRIBUTE_IX_VALUE_TYPE = 3
# ATTRIBUTE_IX_VALUE_DATA = 4
# ATTRIBUTE_LENGHT = 5
#
# CHUNK_AXML_FILE = 0x00080003
# CHUNK_XML_FIRST = 0x00100100
# CHUNK_XML_START_NAMESPACE = 0x00100100
# CHUNK_XML_END_NAMESPACE = 0x00100101
# CHUNK_XML_START_TAG = 0x00100102
# CHUNK_XML_END_TAG = 0x00100103
# CHUNK_XML_TEXT = 0x00100104
# CHUNK_XML_LAST = 0x00100104
#
# START_DOCUMENT = 0
# END_DOCUMENT = 1
# START_TAG = 2
# END_TAG = 3
# TEXT = 4
#
# RADIX_MULTS = [0.00390625, 3.051758E-005, 1.192093E-007, 4.656613E-010]
# DIMENSION_UNITS = ["px", "dip", "sp", "pt", "in", "mm"]
# FRACTION_UNITS = ["%", "%p"]
#
# COMPLEX_UNIT_MASK = 15
Source code for apkutils.axml.chunk

apkutils

Navigation

Related Topics