writing wip

2024-06-26 12:29:32 +00:00 · 2018-09-30 21:54:16 +08:00 · 2018-09-30 21:54:16 +08:00 · d4dfe6dc19
commit d4dfe6dc19
parent 0a3d4e70ef
1 changed files with 382 additions and 156 deletions
--- a/thing.py
+++ b/thing.py
@ -1,5 +1,11 @@
 import struct
 import copy
+import collections
+
+
+def _pad_up(size, factor):
+    x = size + factor - 1
+    return x - (x % factor)

 def _split_bnode(buf, start):
    """Slice a btree node into records, including the node descriptor"""
@ -10,32 +16,8 @@ def _split_bnode(buf, start):
    records = [bytes(buf[start+i_start:start+i_stop]) for (i_start, i_stop) in zip(starts, stops)]
    return ndFLink, ndBLink, ndType, ndNHeight, records

-
-def _join_bnode(buf, start, ndFLink, ndBLink, ndType, ndNHeight, records):
-    buf[start:start+512] = bytes(512)
-
-    next_left = 14
-    next_right = 510
-
-    for r in records:
-        if next_left + len(r) > next_right - 2: raise ValueError('cannot fit these records in a B*-tree node')
-
-        buf[start+next_left:start+next_left+len(r)] = r
-        struct.pack_into('>H', buf, start+next_right, next_left)
-
-        next_left += len(r)
-        next_right -= 2
-
-    struct.pack_into('>H', buf, start+next_right, next_left) # offset of free space
-
-    struct.pack_into('>LLBBH', buf, start, ndFLink, ndBLink, ndType, ndNHeight, len(records))
-
-
-def _deser_btree(buf, start):
-    """Walk an HFS B*-tree, returning an iterator of (key, value) tuples.
-
-    Only leaf nodes are used. Housekeeping data is ignored.
-    """
+def _dump_btree_recs(buf, start):
+    """Walk an HFS B*-tree, returning an iterator of (key, value) tuples."""

    # Get the header node
    ndFLink, ndBLink, ndType, ndNHeight, (header_rec, unused_rec, map_rec) = _split_bnode(buf, start)
@ -44,159 +26,398 @@ def _deser_btree(buf, start):
    bthDepth, bthRoot, bthNRecs, bthFNode, bthLNode, bthNodeSize, bthKeyLen, bthNNodes, bthFree = \
    struct.unpack_from('>HLLLLHHLL', header_rec)

+    # And iterate through the linked list of leaf nodes
    this_leaf = bthFNode
    while True:
        ndFLink, ndBLink, ndType, ndNHeight, records = _split_bnode(buf, start+512*this_leaf)

-        for rec in records:
-            key = rec[1:1+rec[0]]
-            val = rec[1+rec[0]:]
-            yield key, val
+        yield from records

        if this_leaf == bthLNode:
            break
        this_leaf = ndFLink

+def _choose_alloc_size(total_logical_blocks):
+    """Guess a good number of physical blocks per allocation block"""
+    size = 1
+    while size * 65536 < 0.99 * total_logical_blocks:
+        size += 1
+    return size

-def _ser_btree(buf, start, stop, btree_dict):
-    pass
+def _pack_leaf_record(key, value):
+    b = bytes([len(key)]) + key
+    if len(b) & 1: b += bytes(1)
+    b += value
+    return b

-# the above two functions should make this way easier!
+def _pack_index_record(key, pointer):
+    b = bytes([0x25]) + key
+    b += bytes(0x26 - len(b))
+    b += struct.pack('>L', pointer) # check this: are pointers meant to be 4 bytes?
+    return b

-# hell... can I just read the catalog file into a dict, and then
-# dump it back when finished? With lazy back-and-forth?
+def _will_fit_in_leaf_node(keyvals):
+    return len(keyvals) <= 2 # really must fix this!
+
+def _will_fit_in_index_node(keyvals):
+    return len(keyvals) <= 8
+
+class _Node:
+    def __bytes__(self):
+        buf = bytearray(512)
+
+        next_left = 14
+        next_right = 510
+
+        for r in self.records:
+            if next_left + len(r) > next_right - 2:
+                raise ValueError('cannot fit these records in a B*-tree node')
+
+            buf[next_left:next_left+len(r)] = r
+            struct.pack_into('>H', buf, next_right, next_left)
+
+            next_left += len(r)
+            next_right -= 2
+
+        struct.pack_into('>H', buf, next_right, next_left) # offset of free space
+
+        struct.pack_into('>LLBBH', buf, 0,
+            self.ndFLink, self.ndBLink, self.ndType, self.ndNHeight, len(self.records))
+
+        return bytes(buf)
+
+def _mkbtree(records):
+    biglist = [[[]]] # [level][node][record]
+
+    for keyval in records:
+        curnode = biglist[-1][-1]
+        curnode.append(keyval)
+        if not _will_fit_in_leaf_node(curnode):
+            del curnode[-1]
+            curnode = [keyval]
+            biglist[-1].append(curnode)
+
+    while len(biglist[-1]) > 1:
+        biglist.append([[]])
+
+        for prevnode in biglist[-2]:
+            keyval = prevnode[0]
+            curnode = biglist[-1][-1]
+            curnode.append(keyval)
+            if not _will_fit_in_index_node(curnode):
+                del curnode[-1]
+                curnode = [keyval]
+                biglist[-1].append(curnode)
+
+    biglist.reverse() # index nodes then leaf nodes
+
+    # cool, now biglist is of course brilliant
+    for i, level in enumerate(biglist, 1):
+        print('LEVEL', i)
+        for node in level:
+            print('(%d)' % len(node), *(rec[0] for rec in node))
+        print()
+
+    # Make space for a header node at element 0
+    hnode = _Node()
+    nodelist = [hnode]
+    hnode.ndNHeight = 0
+    hnode.records = [bytes(106), bytes(128), bytes(256)]
+    hnode.ndType = 1
+
+    spiderdict = {} # maps (level, key) to index
+
+    for i, level in enumerate(biglist, 1):
+        for node in level:
+            firstkey = node[0][0]
+            spiderdict[i, firstkey] = len(nodelist)
+
+            newnode = _Node()
+            nodelist.append(newnode)
+            newnode.records = node
+            newnode.ndNHeight = i
+
+            if level is biglist[-1]:
+                newnode.ndType = 0xFF # leaf node
+            else:
+                newnode.ndType = 0 # index node
+
+    for n in nodelist:
+        print(n.ndNHeight, n.records)
+        print()
+
+    print(spiderdict)
+
+    # pack the records in the index and leaf nodes
+    for node in nodelist:
+        if node.ndType == 0xFF: # leaf node
+            node.records = [_pack_leaf_record(k, v) for (k, v) in node.records]
+        elif node.ndType == 0: # index node
+            node.records = [_pack_index_record(k, spiderdict[node.ndNHeight+1, k]) for (k, v) in node.records]
+
+    # make the map nodes so that the bitmap covers what we use
+    bits_covered = 2048
+    while bits_covered < len(nodelist):
+        bits_covered += 3952 # bits in a max-sized record
+        mapnode = _Node()
+        nodelist.append(mapnode)
+        mapnode.ndType = 2
+        ndNHeight = 1 # fix, not sure about this
+        mapnode.records = [] # fix this
+
+    # now we run back and forth to join up!
+    most_recent = {}
+    for i, node in enumerate(nodelist):
+        node.ndBLink = most_recent.get(node.ndType, 0)
+        most_recent[node.ndType] = i
+    most_recent = {}
+    for i, node in reversed(list(enumerate(nodelist))):
+        node.ndFLink = most_recent.get(node.ndType, 0)
+        most_recent[node.ndType] = i
+
+    for n in nodelist:
+        print(n.__dict__)
+
+    return b''.join(bytes(node) for node in nodelist)
+
+def _catrec_sorter(b):
+    return b # must fix this later on
+    order = [
+        0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07,
+        0x08, 0x09, 0x0a, 0x0b, 0x0c, 0x0d, 0x0e, 0x0f,
+        0x10, 0x11, 0x12, 0x13, 0x14, 0x15, 0x16, 0x17,
+        0x18, 0x19, 0x1a, 0x1b, 0x1c, 0x1d, 0x1e, 0x1f,
+
+        0x20, 0x22, 0x23, 0x28, 0x29, 0x2a, 0x2b, 0x2c,
+        0x2f, 0x30, 0x31, 0x32, 0x33, 0x34, 0x35, 0x36,
+        0x37, 0x38, 0x39, 0x3a, 0x3b, 0x3c, 0x3d, 0x3e,
+        0x3f, 0x40, 0x41, 0x42, 0x43, 0x44, 0x45, 0x46,
+
+        0x47, 0x48, 0x58, 0x5a, 0x5e, 0x60, 0x67, 0x69,
+        0x6b, 0x6d, 0x73, 0x75, 0x77, 0x79, 0x7b, 0x7f,
+        0x8d, 0x8f, 0x91, 0x93, 0x96, 0x98, 0x9f, 0xa1,
+        0xa3, 0xa5, 0xa8, 0xaa, 0xab, 0xac, 0xad, 0xae,
+
+        0x54, 0x48, 0x58, 0x5a, 0x5e, 0x60, 0x67, 0x69,
+        0x6b, 0x6d, 0x73, 0x75, 0x77, 0x79, 0x7b, 0x7f,
+        0x8d, 0x8f, 0x91, 0x93, 0x96, 0x98, 0x9f, 0xa1,
+        0xa3, 0xa5, 0xa8, 0xaf, 0xb0, 0xb1, 0xb2, 0xb3,
+
+        0x4c, 0x50, 0x5c, 0x62, 0x7d, 0x81, 0x9a, 0x55,
+        0x4a, 0x56, 0x4c, 0x4e, 0x50, 0x5c, 0x62, 0x64,
+        0x65, 0x66, 0x6f, 0x70, 0x71, 0x72, 0x7d, 0x89,
+        0x8a, 0x8b, 0x81, 0x83, 0x9c, 0x9d, 0x9e, 0x9a,
+
+        0xb4, 0xb5, 0xb6, 0xb7, 0xb8, 0xb9, 0xba, 0x95,
+        0xbb, 0xbc, 0xbd, 0xbe, 0xbf, 0xc0, 0x52, 0x85,
+        0xc1, 0xc2, 0xc3, 0xc4, 0xc5, 0xc6, 0xc7, 0xc8,
+        0xc9, 0xca, 0xcb, 0x57, 0x8c, 0xcc, 0x52, 0x85,
+
+        0xcd, 0xce, 0xcf, 0xd0, 0xd1, 0xd2, 0xd3, 0x26,
+        0x27, 0xd4, 0x20, 0x4a, 0x4e, 0x83, 0x87, 0x87,
+        0xd5, 0xd6, 0x24, 0x25, 0x2d, 0x2e, 0xd7, 0xd8,
+        0xa7, 0xd9, 0xda, 0xdb, 0xdc, 0xdd, 0xde, 0xdf,
+
+        0xe0, 0xe1, 0xe2, 0xe3, 0xe4, 0xe5, 0xe6, 0xe7,
+        0xe8, 0xe9, 0xea, 0xeb, 0xec, 0xed, 0xee, 0xef,
+        0xf0, 0xf1, 0xf2, 0xf3, 0xf4, 0xf5, 0xf6, 0xf7,
+        0xf8, 0xf9, 0xfa, 0xfb, 0xfc, 0xfd, 0xfe, 0xff,
+    ]
+    length = b[4]
+    name = b[5:5+length]
+    return b[:4] + bytes(order[ch] for ch in name)


-def _from_tuple(val):
-    if len(val) == 1:
-        return val[0]
-    else:
-        return val
+class File:
+    def __init__(self):
+        self.type = b'????'
+        self.creator = b'????'
+        self.flags = 0 # help me!
+        self.x = 0 # where to put this spatially?
+        self.y = 0

-def _to_tuple(val):
-    if isinstance(val, tuple):
-        return val
-    else:
-        return (val,)
+        self.locked = False
+        self.crdat = self.mddat = self.bkdat = 0

-def _field(offset, fmt, doc=''):
-    fget = lambda self: _from_tuple(struct.unpack_from(fmt, self.buf, offset))
-    fset = lambda self, val: struct.pack_into(fmt, self.buf, offset, _to_tuple(val))
-    prop = property(fget, fset)
-    if doc:
-        prop.__doc__ = doc
-    return prop
+        self.rsrc = bytearray()
+        self.data = bytearray()

-def _mobilefield(offset, fmt, doc=''):
-    fget = lambda self: _from_tuple(struct.unpack_from(fmt, self.buf, self.structoffset+offset))
-    fset = lambda self, val: struct.pack_into(fmt, self.buf, self.structoffset+offset, _to_tuple(val))
-    prop = property(fget, fset)
-    if doc:
-        prop.__doc__ = doc
-    return prop
+    def __str__(self):
+        return 'File %r/%r data=%db rsrc=%db' % (self.type, self.creator, len(self.data), len(self.rsrc))

-class HFS:
-    bbID = _field(0, '>H', doc='boot blocks signature')
-    bbEntry = _field(2, '>L', doc='entry point to boot code')
-    bbVersion = _field(6, '>H', doc='boot blocks version number')
-    bbPageFlags = _field(8, '>H', doc='used internally')
-    bbSysName = _field(10, '16p', doc='System filename')
-    bbShellName = _field(26, '16p', doc='Finder filename')
-    bbDbg1Name = _field(42, '16p', doc='debugger filename')
-    bbDbg2Name = _field(58, '16p', doc='debugger filename')
-    bbScreenName = _field(74, '16p', doc='name of startup screen')
-    bbHelloName = _field(90, '16p', doc='name of startup program')
-    bbScrapName = _field(106, '16p', doc='name of system scrap file')
-    bbCntFCBs = _field(122, '>H', doc='number of FCBs to allocate')
-    bbCntEvts = _field(124, '>H', doc='number of event queue elements')
-    bb128KSHeap = _field(126, '>L', doc='system heap size on 128K Mac')
-    bb256KSHeap = _field(130, '>L', doc='used internally')
-    bbSysHeapSize = _field(134, '>L', doc='system heap size on all machines')
-    bbFiller = _field(138, '>H', doc='reserved')
-    bbSysHeapExtra = _field(140, '>L', doc='additional system heap space')
-    bbSysHeapFract = _field(144, '>L', doc='fraction of RAM for system heap')

-    drSigWord = _field(1024+0, '>H', doc='volume signature')
-    drCrDate = _field(1024+2, '>L', doc='date and time of volume creation')
-    drLsMod = _field(1024+6, '>L', doc='date and time of last modification')
-    drAtrb = _field(1024+10, '>H', doc='volume attributes')
-    drNmFls = _field(1024+12, '>H', doc='number of files in root directory')
-    drVBMSt = _field(1024+14, '>H', doc='first block of volume bitmap')
-    drAllocPtr = _field(1024+16, '>H', doc='start of next allocation search')
-    drNmAlBlks = _field(1024+18, '>H', doc='number of allocation blocks in volume')
-    drAlBlkSiz = _field(1024+20, '>L', doc='size (in bytes) of allocation blocks')
-    drClpSiz = _field(1024+24, '>L', doc='default clump size')
-    drAlBlSt = _field(1024+28, '>H', doc='first allocation block in volume')
-    drNxtCNID = _field(1024+30, '>L', doc='next unused catalog node ID')
-    drFreeBks = _field(1024+34, '>H', doc='number of unused allocation blocks')
-    drVN = _field(1024+36, '28p', doc='volume name Pascal string')
-    drVolBkUp = _field(1024+64, '>L', doc='date and time of last backup')
-    drVSeqNum = _field(1024+68, '>H', doc='volume backup sequence number')
-    drWrCnt = _field(1024+70, '>L', doc='volume write count')
-    drXTClpSiz = _field(1024+74, '>L', doc='clump size for extents overflow file')
-    drCTClpSiz = _field(1024+78, '>L', doc='clump size for catalog file')
-    drNmRtDirs = _field(1024+82, '>H', doc='number of directories in root directory')
-    drFilCnt = _field(1024+84, '>L', doc='number of files in volume')
-    drDirCnt = _field(1024+88, '>L', doc='number of directories in volume')
-    drFndrInfo = _field(1024+92, '32s', doc='information used by the Finder')
-    drVCSize = _field(1024+124, '>H', doc='size (in blocks) of volume cache')
-    drVBMCSize = _field(1024+126, '>H', doc='size (in blocks) of volume bitmap cache')
-    drCtlCSize = _field(1024+128, '>H', doc='size (in blocks) of common volume cache')
-    drXTFlSize = _field(1024+130, '>L', doc='size of extents overflow file')
-    drXTExtRec = _field(1024+134, '>6H', doc='extent record for extents overflow file')
-    drCTFlSize = _field(1024+146, '>L', doc='size of catalog file')
-    drCTExtRec = _field(1024+150, '>6H', doc='extent record for catalog file')
+class _AbstractFolder(dict):
+    def paths(self):
+        for name, child in self.items():
+            yield ((name,), child)
+            try:
+                childs_children = child.paths()
+            except AttributeError:
+                pass
+            else:
+                for each_path, each_child in childs_children:
+                    yield (name,) + each_path, each_child

-    ndFLink = _mobilefield(0, '>L', doc='forward link')
-    ndBLink = _mobilefield(4, '>L', doc='backward link')
-    ndType = _mobilefield(8, '>B', doc='node type')
-    ndIndxNode = 0x00; ndHdrNode = 0x01; ndMapNode = 0x02; ndLeafNode = 0xFF
-    ndNHeight = _mobilefield(9, '>L', doc='node level')
-    ndNRecs = _mobilefield(10, '>H', doc='number of records in node')
-    ndResv2 = _mobilefield(12, '>H', doc='reserved')
+    def __str__(self):
+        return 'Folder valence=%d' % len(self)

-    bthDepth = _mobilefield(14+0, '>H', doc='current depth of tree')
-    bthRoot = _mobilefield(14+2, '>L', doc='number of root node')
-    bthNRecs = _mobilefield(14+6, '>L', doc='number of leaf records in tree')
-    bthFNode = _mobilefield(14+10, '>L', doc='number of first leaf node')
-    bthLNode = _mobilefield(14+14, '>L', doc='number of last leaf node')
-    bthNodeSize = _mobilefield(14+18, '>H', doc='size of a node')
-    bthKeyLen = _mobilefield(14+20, '>H', doc='maximum length of a key')
-    bthNNodes = _mobilefield(14+22, '>L', doc='total number of nodes in tree')
-    bthFree = _mobilefield(14+26, '>L', doc='number of free nodes')

-    def _dump_attrs(self, prefix=''):
-        print('Dumping %s*:' % prefix)
-        for key in (k for k in dir(self) if k.startswith(prefix)):
-            print('', key, hex(getattr(self, key)))
+class Folder(_AbstractFolder):
+    def __init__(self):
+        super().__init__()
+
+        self.flags = 0 # help me!
+        self.x = 0 # where to put this spatially?
+        self.y = 0
+
+        self.crdat = self.mddat = self.bkdat = 0
+
+
+class Volume(_AbstractFolder):
+    def __init__(self):
+        super().__init__()
+
+        self.bootblocks = bytes(1024)       # optional; for booting HFS volumes
+        self.drCrDate = 0                   # date and time of volume creation
+        self.drLsMod = 0                    # date and time of last modification
+        self.drAtrb = 0                     # volume attributes (hwlock, swlock, cleanunmount, badblocks)
+        self.drVN = b'Untitled'             # volume name Pascal string
+        self.drVolBkUp = 0                  # date and time of last backup
+        self.drVSeqNum = 0                  # volume backup sequence number
+        self.drFndrInfo = bytes(32)         # information used by the Finder
+
+    def read(self, from_volume):
+        self._dirtree = {}
+        self.bootblocks = from_volume[:1024]
+
+        drSigWord, self.drCrDate, self.drLsMod, self.drAtrb, drNmFls, \
+        drVBMSt, drAllocPtr, drNmAlBlks, drAlBlkSiz, drClpSiz, drAlBlSt, \
+        drNxtCNID, drFreeBks, self.drVN, self.drVolBkUp, self.drVSeqNum, \
+        drWrCnt, drXTClpSiz, drCTClpSiz, drNmRtDirs, drFilCnt, drDirCnt, \
+        self.drFndrInfo, drVCSize, drVBMCSize, drCtlCSize, \
+        drXTFlSize, drXTExtRec_Start, drXTExtRec_Cnt, _, _, _, _, \
+        drCTFlSize, drCTExtRec_Start, drCTExtRec_Cnt, _, _, _, _, \
+        = struct.unpack_from('>2sLLHHHHHLLHLH28pLHLLLHLL32sHHHL6HL6H', from_volume, 1024)
+
+        extoflow = {}
+
+        for rec in _dump_btree_recs(from_volume, 512*drAlBlSt + drAlBlkSiz*drXTExtRec_Start):
+            if rec[0] != 7: continue
+            # print(key, val)
+            pass
+
+        cnids = {}
+        childrenof = collections.defaultdict(dict)
+
+        for rec in _dump_btree_recs(from_volume, 512*drAlBlSt + drAlBlkSiz*drCTExtRec_Start):
+            # create a directory tree from the catalog file
+            if rec[0] == 0: continue
+            rec_len = rec[0]
+            key = rec[1:1+rec_len]
+            val = rec[_pad_up(1+rec_len, 2):]
+
+            ckrParID, namelen = struct.unpack_from('>LB', key, 1)
+            ckrCName = key[6:6+namelen]
+
+            datatype = val[0]
+            datarec = val[2:]
+
+            if datatype == 1: # directory
+                dirFlags, dirVal, dirDirID, dirCrDat, dirMdDat, dirBkDat, dirUsrInfo, dirFndrInfo \
+                = struct.unpack_from('>HHLLLL16s16s', datarec)
+
+                f = Folder()
+                cnids[dirDirID] = f
+                childrenof[ckrParID][ckrCName] = f
+
+                f.crdat, f.mddat, f.bkdat = dirCrDat, dirMdDat, dirBkDat
+
+            elif datatype == 2: # file (ignore "thread records" when reading)
+                filFlags, filTyp, filUsrWds, filFlNum, \
+                filStBlk, filLgLen, filPyLen, \
+                filRStBlk, filRLgLen, filRPyLen, \
+                filCrDat, filMdDat, filBkDat, \
+                filFndrInfo, filClpSize, \
+                filExtRec, filRExtRec, \
+                = struct.unpack_from('>BB16sLHLLHLLLLL16sH12s12sxxxx', datarec)
+
+                f = File()
+                cnids[filFlNum] = f
+                childrenof[ckrParID][ckrCName] = f
+
+                f.crdat, f.mddat, f.bkdat = filCrDat, filMdDat, filBkDat
+                f.type, f.creator, f.flags, f.x, f.y = struct.unpack_from('>4s4sHHH', filUsrWds)
+
+                for fork, length, extrec in [('data', filLgLen, filExtRec), ('rsrc', filRLgLen, filRExtRec)]:
+                    accum = bytearray()
+                    extrec = list(struct.unpack('>HHHHHH', extrec))
+                    extrec = list(zip(extrec[::2], extrec[1::2]))
+                    for extstart, extlength in extrec:
+                        if extlength == 0: continue
+                        astart = 512*drAlBlSt + drAlBlkSiz*extstart
+                        astop = astart + drAlBlkSiz*extlength
+                        accum.extend(from_volume[astart:astop])
+                    del accum[length:] # logical length can be less than a number of blocks
+                    if len(accum) != length:
+                        raise ValueError('need to consult extents overflow file')
+
+                    setattr(f, fork, accum)
+
+        for parent, children in childrenof.items():
+            if parent != 1: # not the mythical parent of root!
+                cnids[parent].update(children)
+
+        self.update(cnids[2])
+
+    def write(self, size=None):
+        pass
+
+        drAlBlkSiz = 4096
+
+        catalog = []
+
+        cnids = {} # keys are path-component-tuples
+        objects = {}
+        next_cnid = 16
+
+        for path, obj in self.paths():
+            # what needs to happen here? we create a file/folder entry, a thread entry, what else?
+
+            cnids[path] = next_cnid; this_cnid = next_cnid; next_cnid += 1
+            objects[path] = obj
+
+            if isinstance(obj, File):
+                filFlags = 0 # todo must fix
+                filTyp = 0
+                filUsrWds = struct.pack('>4s4sHHHxxxxxx', obj.type, obj.creator, obj.flags, obj.x, obj.y)
+                filFlNum = next_cnid
+                filStBlk, filLgLen, filPyLen = 0, len(obj.data), _pad_up(len(obj.data), drAlBlkSiz) # todo must fix
+                filRStBlk, filRLgLen, filRPyLen = 0, len(obj.rsrc), _pad_up(len(obj.rsrc), drAlBlkSiz) # todo must fix
+                filCrDat, filMdDat, filBkDat = obj.crdat, obj.mddat, obj.bkdat
+                filFndrInfo = bytes(16) # todo must fix
+                filClpSize = 0 # todo must fix
+                filExtRec = struct.pack('>HHHHHH', 0, _pad_up(len(obj.data), drAlBlkSiz) // drAlBlkSiz, 0, 0, 0, 0)
+                filRExtRec = struct.pack('>HHHHHH', 0, _pad_up(len(obj.rsrc), drAlBlkSiz) // drAlBlkSiz, 0, 0, 0, 0)
+
+                rec = bytearray(struct.pack('>BB16sLHLLHLLLLL16sH12s12sxxxx',
+                    filFlags, filTyp, filUsrWds, filFlNum, \
+                    filStBlk, filLgLen, filPyLen, \
+                    filRStBlk, filRLgLen, filRPyLen, \
+                    filCrDat, filMdDat, filBkDat, \
+                    filFndrInfo, filClpSize, \
+                    filExtRec, filRExtRec, \
+                ))
+
+                catalog.append((path[-1], rec))
+
+        catalog.sort(key=_catrec_sorter)
+        _mkbtree(catalog)
+

-    def ablk_offset(self, ablkidx):
-        """Get byte offset from alloc block (ablk) number"""
-        bits_per_pblk = 512 * 8
-        ignoreblks = self.drVBMSt + (self.drNmAlBlks + bits_per_pblk - 1) // bits_per_pblk
-        return ignoreblks * 512 + ablkidx * self.drAlBlkSiz

-    def __init__(self, buf):
-        self.structoffset = 0
-        self.buf = buf
-        self.cache = {}

-    def __add__(self, structoffset):
-        cp = copy.copy(self)
-        cp.structoffset += structoffset
-        return cp
-    def __sub__(self, negoffset):
-        return self.__add__(-negoffset)

-    def clrcache(self):
-        """Clear the cache because external code has changed the buffer."""
-        self.cache.clear()

-    def walk_catalog(self):
-        catalog_offset = self.ablk_offset(self.drCTExtRec[0])
-        bt = _deser_btree(self.buf, catalog_offset)
-        for key, val in bt.items():
-            print(key, val)



@ -205,10 +426,15 @@ if sys.argv[1:]:
    infile = sys.argv[1]
 else:
    infile = 'SourceForEmulator.dmg'
-
-h = HFS(bytearray(open(infile,'rb').read()))
-
-h.walk_catalog()
+import pprint
+h = Volume()
+h.read(open(infile,'rb').read())
+# open('/tmp/aj', 'wb').write(h[b'Extensions'][b'AppleJack 2.1'].rsrc)
+# pprint.pprint(h)
+# for path, obj in h.paths():
+#     print(path, obj)
+h.write()
+# h.walk_catalog()