From 3685df969ff1391688a468d8fb2cc48e29a6ea3e Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 4 Dec 2025 13:12:44 -0500
Subject: [PATCH 01/36] WIP

---
 Makefile                  |   12 +-
 src/hasm/ido/math_util.s  | 1780 +++++++++++++++++++++++++++++++++++++
 ver/splat/dkr.us.v77.yaml |    4 +-
 3 files changed, 1793 insertions(+), 3 deletions(-)
 create mode 100644 src/hasm/ido/math_util.s

diff --git a/Makefile b/Makefile
index 20b01527f..6ec96197e 100755
--- a/Makefile
+++ b/Makefile
@@ -59,7 +59,7 @@ BUILD_DIR = build
 SRC_DIR   = src
 LIBULTRA_DIR = libultra
 ASM_DIRS  = asm asm/data asm/assets asm/nonmatchings
-HASM_DIRS = $(SRC_DIR)/hasm $(LIBULTRA_DIR)/src/os $(LIBULTRA_DIR)/src/gu $(LIBULTRA_DIR)/src/libc
+HASM_DIRS = $(SRC_DIR)/hasm $(SRC_DIR)/hasm/ido $(LIBULTRA_DIR)/src/os $(LIBULTRA_DIR)/src/gu $(LIBULTRA_DIR)/src/libc
 LIBULTRA_SRC_DIRS  = $(LIBULTRA_DIR) $(LIBULTRA_DIR)/src $(LIBULTRA_DIR)/src/audio $(LIBULTRA_DIR)/src/audio/mips1
 LIBULTRA_SRC_DIRS += $(LIBULTRA_DIR)/src/debug $(LIBULTRA_DIR)/src/gu $(LIBULTRA_DIR)/src/io
 LIBULTRA_SRC_DIRS += $(LIBULTRA_DIR)/src/libc $(LIBULTRA_DIR)/src/os $(LIBULTRA_DIR)/src/sc
@@ -275,6 +275,9 @@ $(BUILD_DIR)/$(LIBULTRA_DIR)/%.s.o: MIPSISET := -mips2
 $(BUILD_DIR)/$(LIBULTRA_DIR)/src/libc/%.s.o: OPT_FLAGS := -O2
 $(BUILD_DIR)/$(LIBULTRA_DIR)/src/os/exceptasm.s.o: MIPSISET := -mips3 -32
 
+# $(BUILD_DIR)/$(SRC_DIR)/hasm/ido/math_util.s.o: OPT_FLAGS := -O2
+# $(BUILD_DIR)/$(SRC_DIR)/hasm/ido/math_util.s.o: MIPSISET := -mips3 -32
+
 # Allow dollar sign to be used in var names for this file alone
 # It allows us to return the current stack pointer
 $(BUILD_DIR)/$(SRC_DIR)/get_stack_pointer.c.o: OPT_FLAGS += -dollar
@@ -464,6 +467,13 @@ $(BUILD_DIR)/$(LIBULTRA_DIR)/%.s.o: $(LIBULTRA_DIR)/%.s | build_assets
 	@if [ "$(MIPSISET)" = "-mips3 -32" ]; then \
 		$(PYTHON) $(TOOLS_DIR)/python/patchmips3.py $@ || rm $@; \
 	fi
+# $(BUILD_DIR)/$(SRC_DIR)/hasm/ido/%.s.o: $(SRC_DIR)/hasm/ido/%.s | build_assets
+# 	$(call print,Assembling IDO:,$<,$@)
+# 	$(V)$(CC) -c $(CFLAGS) $(CC_WARNINGS) $(OPT_FLAGS) $(MIPSISET) -o $@ $<
+# 	$(V)$(STRIP) --strip-unneeded $@
+# 	@if [ "$(MIPSISET)" = "-mips3 -32" ]; then \
+# 		$(PYTHON) $(TOOLS_DIR)/python/patchmips3.py $@ || rm $@; \
+# 	fi
 else
 # libultra asm files - Compile with the gcc c compiler
 $(BUILD_DIR)/$(LIBULTRA_DIR)/%.s.o: $(LIBULTRA_DIR)/%.s | build_assets
diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
new file mode 100644
index 000000000..bf9aa2615
--- /dev/null
+++ b/src/hasm/ido/math_util.s
@@ -0,0 +1,1780 @@
+#ifdef MODERN_CC
+.set gp=64
+#endif
+
+#include "PR/R4300.h"
+#include "sys/asm.h"
+#include "sys/regdef.h"
+
+.data
+
+EXPORT(gIntDisFlag)
+    .byte 0x00
+
+EXPORT(gCurrentRNGSeed)
+    .word 0x5141564D /* 'QAVM' */
+
+EXPORT(gPrevRNGSeed)
+    .word 0x5141564D /* 'QAVM' */
+
+/* 1025 unsigned 16 bit integer values 0-1024 */
+EXPORT(gSineTable)
+    .half 0x0000, 0x0032, 0x0065, 0x0097, 0x00C9, 0x00FB, 0x012E, 0x0160, 0x0192, 0x01C4, 0x01F7, 0x0229, 0x025B, 0x028D, 0x02C0
+    .half 0x02F2, 0x0324, 0x0356, 0x0389, 0x03BB, 0x03ED, 0x041F, 0x0452, 0x0484, 0x04B6, 0x04E8, 0x051B, 0x054D, 0x057F, 0x05B1
+    .half 0x05E3, 0x0616, 0x0648, 0x067A, 0x06AC, 0x06DE, 0x0711, 0x0743, 0x0775, 0x07A7, 0x07D9, 0x080C, 0x083E, 0x0870, 0x08A2
+    .half 0x08D4, 0x0906, 0x0938, 0x096B, 0x099D, 0x09CF, 0x0A01, 0x0A33, 0x0A65, 0x0A97, 0x0AC9, 0x0AFB, 0x0B2D, 0x0B60, 0x0B92
+    .half 0x0BC4, 0x0BF6, 0x0C28, 0x0C5A, 0x0C8C, 0x0CBE, 0x0CF0, 0x0D22, 0x0D54, 0x0D86, 0x0DB8, 0x0DEA, 0x0E1C, 0x0E4E, 0x0E80
+    .half 0x0EB2, 0x0EE4, 0x0F15, 0x0F47, 0x0F79, 0x0FAB, 0x0FDD, 0x100F, 0x1041, 0x1073, 0x10A4, 0x10D6, 0x1108, 0x113A, 0x116C
+    .half 0x119E, 0x11CF, 0x1201, 0x1233, 0x1265, 0x1296, 0x12C8, 0x12FA, 0x132B, 0x135D, 0x138F, 0x13C1, 0x13F2, 0x1424, 0x1455
+    .half 0x1487, 0x14B9, 0x14EA, 0x151C, 0x154D, 0x157F, 0x15B1, 0x15E2, 0x1614, 0x1645, 0x1677, 0x16A8, 0x16DA, 0x170B, 0x173C
+    .half 0x176E, 0x179F, 0x17D1, 0x1802, 0x1833, 0x1865, 0x1896, 0x18C7, 0x18F9, 0x192A, 0x195B, 0x198D, 0x19BE, 0x19EF, 0x1A20
+    .half 0x1A51, 0x1A83, 0x1AB4, 0x1AE5, 0x1B16, 0x1B47, 0x1B78, 0x1BA9, 0x1BDA, 0x1C0C, 0x1C3D, 0x1C6E, 0x1C9F, 0x1CD0, 0x1D01
+    .half 0x1D31, 0x1D62, 0x1D93, 0x1DC4, 0x1DF5, 0x1E26, 0x1E57, 0x1E88, 0x1EB8, 0x1EE9, 0x1F1A, 0x1F4B, 0x1F7B, 0x1FAC, 0x1FDD
+    .half 0x200E, 0x203E, 0x206F, 0x209F, 0x20D0, 0x2101, 0x2131, 0x2162, 0x2192, 0x21C3, 0x21F3, 0x2224, 0x2254, 0x2284, 0x22B5
+    .half 0x22E5, 0x2316, 0x2346, 0x2376, 0x23A7, 0x23D7, 0x2407, 0x2437, 0x2467, 0x2498, 0x24C8, 0x24F8, 0x2528, 0x2558, 0x2588
+    .half 0x25B8, 0x25E8, 0x2618, 0x2648, 0x2678, 0x26A8, 0x26D8, 0x2708, 0x2738, 0x2768, 0x2797, 0x27C7, 0x27F7, 0x2827, 0x2856
+    .half 0x2886, 0x28B6, 0x28E5, 0x2915, 0x2945, 0x2974, 0x29A4, 0x29D3, 0x2A03, 0x2A32, 0x2A62, 0x2A91, 0x2AC1, 0x2AF0, 0x2B1F
+    .half 0x2B4F, 0x2B7E, 0x2BAD, 0x2BDC, 0x2C0C, 0x2C3B, 0x2C6A, 0x2C99, 0x2CC8, 0x2CF7, 0x2D26, 0x2D55, 0x2D84, 0x2DB3, 0x2DE2
+    .half 0x2E11, 0x2E40, 0x2E6F, 0x2E9E, 0x2ECC, 0x2EFB, 0x2F2A, 0x2F59, 0x2F87, 0x2FB6, 0x2FE5, 0x3013, 0x3042, 0x3070, 0x309F
+    .half 0x30CD, 0x30FC, 0x312A, 0x3159, 0x3187, 0x31B5, 0x31E4, 0x3212, 0x3240, 0x326E, 0x329D, 0x32CB, 0x32F9, 0x3327, 0x3355
+    .half 0x3383, 0x33B1, 0x33DF, 0x340D, 0x343B, 0x3469, 0x3497, 0x34C4, 0x34F2, 0x3520, 0x354E, 0x357B, 0x35A9, 0x35D7, 0x3604
+    .half 0x3632, 0x365F, 0x368D, 0x36BA, 0x36E8, 0x3715, 0x3742, 0x3770, 0x379D, 0x37CA, 0x37F7, 0x3825, 0x3852, 0x387F, 0x38AC
+    .half 0x38D9, 0x3906, 0x3933, 0x3960, 0x398D, 0x39BA, 0x39E7, 0x3A13, 0x3A40, 0x3A6D, 0x3A9A, 0x3AC6, 0x3AF3, 0x3B20, 0x3B4C
+    .half 0x3B79, 0x3BA5, 0x3BD2, 0x3BFE, 0x3C2A, 0x3C57, 0x3C83, 0x3CAF, 0x3CDC, 0x3D08, 0x3D34, 0x3D60, 0x3D8C, 0x3DB8, 0x3DE4
+    .half 0x3E10, 0x3E3C, 0x3E68, 0x3E94, 0x3EC0, 0x3EEC, 0x3F17, 0x3F43, 0x3F6F, 0x3F9A, 0x3FC6, 0x3FF1, 0x401D, 0x4048, 0x4074
+    .half 0x409F, 0x40CB, 0x40F6, 0x4121, 0x414D, 0x4178, 0x41A3, 0x41CE, 0x41F9, 0x4224, 0x424F, 0x427A, 0x42A5, 0x42D0, 0x42FB
+    .half 0x4326, 0x4351, 0x437B, 0x43A6, 0x43D1, 0x43FB, 0x4426, 0x4450, 0x447B, 0x44A5, 0x44D0, 0x44FA, 0x4524, 0x454F, 0x4579
+    .half 0x45A3, 0x45CD, 0x45F7, 0x4621, 0x464B, 0x4675, 0x469F, 0x46C9, 0x46F3, 0x471D, 0x4747, 0x4770, 0x479A, 0x47C4, 0x47ED
+    .half 0x4817, 0x4840, 0x486A, 0x4893, 0x48BD, 0x48E6, 0x490F, 0x4939, 0x4962, 0x498B, 0x49B4, 0x49DD, 0x4A06, 0x4A2F, 0x4A58
+    .half 0x4A81, 0x4AAA, 0x4AD3, 0x4AFB, 0x4B24, 0x4B4D, 0x4B75, 0x4B9E, 0x4BC7, 0x4BEF, 0x4C17, 0x4C40, 0x4C68, 0x4C91, 0x4CB9
+    .half 0x4CE1, 0x4D09, 0x4D31, 0x4D59, 0x4D81, 0x4DA9, 0x4DD1, 0x4DF9, 0x4E21, 0x4E49, 0x4E71, 0x4E98, 0x4EC0, 0x4EE8, 0x4F0F
+    .half 0x4F37, 0x4F5E, 0x4F85, 0x4FAD, 0x4FD4, 0x4FFB, 0x5023, 0x504A, 0x5071, 0x5098, 0x50BF, 0x50E6, 0x510D, 0x5134, 0x515B
+    .half 0x5181, 0x51A8, 0x51CF, 0x51F5, 0x521C, 0x5243, 0x5269, 0x5290, 0x52B6, 0x52DC, 0x5303, 0x5329, 0x534F, 0x5375, 0x539B
+    .half 0x53C1, 0x53E7, 0x540D, 0x5433, 0x5459, 0x547F, 0x54A4, 0x54CA, 0x54F0, 0x5515, 0x553B, 0x5560, 0x5586, 0x55AB, 0x55D0
+    .half 0x55F6, 0x561B, 0x5640, 0x5665, 0x568A, 0x56AF, 0x56D4, 0x56F9, 0x571E, 0x5743, 0x5767, 0x578C, 0x57B1, 0x57D5, 0x57FA
+    .half 0x581E, 0x5843, 0x5867, 0x588C, 0x58B0, 0x58D4, 0x58F8, 0x591C, 0x5940, 0x5964, 0x5988, 0x59AC, 0x59D0, 0x59F4, 0x5A18
+    .half 0x5A3B, 0x5A5F, 0x5A82, 0x5AA6, 0x5AC9, 0x5AED, 0x5B10, 0x5B34, 0x5B57, 0x5B7A, 0x5B9D, 0x5BC0, 0x5BE3, 0x5C06, 0x5C29
+    .half 0x5C4C, 0x5C6F, 0x5C91, 0x5CB4, 0x5CD7, 0x5CF9, 0x5D1C, 0x5D3E, 0x5D61, 0x5D83, 0x5DA5, 0x5DC8, 0x5DEA, 0x5E0C, 0x5E2E
+    .half 0x5E50, 0x5E72, 0x5E94, 0x5EB6, 0x5ED7, 0x5EF9, 0x5F1B, 0x5F3C, 0x5F5E, 0x5F80, 0x5FA1, 0x5FC2, 0x5FE4, 0x6005, 0x6026
+    .half 0x6047, 0x6068, 0x6089, 0x60AA, 0x60CB, 0x60EC, 0x610D, 0x612E, 0x614E, 0x616F, 0x6190, 0x61B0, 0x61D1, 0x61F1, 0x6211
+    .half 0x6232, 0x6252, 0x6272, 0x6292, 0x62B2, 0x62D2, 0x62F2, 0x6312, 0x6332, 0x6351, 0x6371, 0x6391, 0x63B0, 0x63D0, 0x63EF
+    .half 0x640F, 0x642E, 0x644D, 0x646C, 0x648B, 0x64AB, 0x64CA, 0x64E9, 0x6507, 0x6526, 0x6545, 0x6564, 0x6582, 0x65A1, 0x65C0
+    .half 0x65DE, 0x65FC, 0x661B, 0x6639, 0x6657, 0x6675, 0x6693, 0x66B2, 0x66D0, 0x66ED, 0x670B, 0x6729, 0x6747, 0x6764, 0x6782
+    .half 0x67A0, 0x67BD, 0x67DA, 0x67F8, 0x6815, 0x6832, 0x6850, 0x686D, 0x688A, 0x68A7, 0x68C4, 0x68E0, 0x68FD, 0x691A, 0x6937
+    .half 0x6953, 0x6970, 0x698C, 0x69A9, 0x69C5, 0x69E1, 0x69FD, 0x6A1A, 0x6A36, 0x6A52, 0x6A6E, 0x6A89, 0x6AA5, 0x6AC1, 0x6ADD
+    .half 0x6AF8, 0x6B14, 0x6B30, 0x6B4B, 0x6B66, 0x6B82, 0x6B9D, 0x6BB8, 0x6BD3, 0x6BEE, 0x6C09, 0x6C24, 0x6C3F, 0x6C5A, 0x6C75
+    .half 0x6C8F, 0x6CAA, 0x6CC4, 0x6CDF, 0x6CF9, 0x6D14, 0x6D2E, 0x6D48, 0x6D62, 0x6D7C, 0x6D96, 0x6DB0, 0x6DCA, 0x6DE4, 0x6DFE
+    .half 0x6E17, 0x6E31, 0x6E4A, 0x6E64, 0x6E7D, 0x6E97, 0x6EB0, 0x6EC9, 0x6EE2, 0x6EFB, 0x6F14, 0x6F2D, 0x6F46, 0x6F5F, 0x6F78
+    .half 0x6F90, 0x6FA9, 0x6FC2, 0x6FDA, 0x6FF2, 0x700B, 0x7023, 0x703B, 0x7053, 0x706B, 0x7083, 0x709B, 0x70B3, 0x70CB, 0x70E3
+    .half 0x70FA, 0x7112, 0x712A, 0x7141, 0x7158, 0x7170, 0x7187, 0x719E, 0x71B5, 0x71CC, 0x71E3, 0x71FA, 0x7211, 0x7228, 0x723F
+    .half 0x7255, 0x726C, 0x7282, 0x7299, 0x72AF, 0x72C5, 0x72DC, 0x72F2, 0x7308, 0x731E, 0x7334, 0x734A, 0x735F, 0x7375, 0x738B
+    .half 0x73A0, 0x73B6, 0x73CB, 0x73E1, 0x73F6, 0x740B, 0x7421, 0x7436, 0x744B, 0x7460, 0x7475, 0x7489, 0x749E, 0x74B3, 0x74C7
+    .half 0x74DC, 0x74F0, 0x7505, 0x7519, 0x752D, 0x7542, 0x7556, 0x756A, 0x757E, 0x7592, 0x75A6, 0x75B9, 0x75CD, 0x75E1, 0x75F4
+    .half 0x7608, 0x761B, 0x762E, 0x7642, 0x7655, 0x7668, 0x767B, 0x768E, 0x76A1, 0x76B4, 0x76C7, 0x76D9, 0x76EC, 0x76FE, 0x7711
+    .half 0x7723, 0x7736, 0x7748, 0x775A, 0x776C, 0x777E, 0x7790, 0x77A2, 0x77B4, 0x77C6, 0x77D8, 0x77E9, 0x77FB, 0x780C, 0x781E
+    .half 0x782F, 0x7840, 0x7851, 0x7863, 0x7874, 0x7885, 0x7895, 0x78A6, 0x78B7, 0x78C8, 0x78D8, 0x78E9, 0x78F9, 0x790A, 0x791A
+    .half 0x792A, 0x793A, 0x794A, 0x795B, 0x796A, 0x797A, 0x798A, 0x799A, 0x79AA, 0x79B9, 0x79C9, 0x79D8, 0x79E7, 0x79F7, 0x7A06
+    .half 0x7A15, 0x7A24, 0x7A33, 0x7A42, 0x7A51, 0x7A60, 0x7A6E, 0x7A7D, 0x7A8C, 0x7A9A, 0x7AA8, 0x7AB7, 0x7AC5, 0x7AD3, 0x7AE1
+    .half 0x7AEF, 0x7AFD, 0x7B0B, 0x7B19, 0x7B27, 0x7B34, 0x7B42, 0x7B50, 0x7B5D, 0x7B6A, 0x7B78, 0x7B85, 0x7B92, 0x7B9F, 0x7BAC
+    .half 0x7BB9, 0x7BC6, 0x7BD3, 0x7BDF, 0x7BEC, 0x7BF9, 0x7C05, 0x7C11, 0x7C1E, 0x7C2A, 0x7C36, 0x7C42, 0x7C4E, 0x7C5A, 0x7C66
+    .half 0x7C72, 0x7C7E, 0x7C89, 0x7C95, 0x7CA0, 0x7CAC, 0x7CB7, 0x7CC2, 0x7CCE, 0x7CD9, 0x7CE4, 0x7CEF, 0x7CFA, 0x7D05, 0x7D0F
+    .half 0x7D1A, 0x7D25, 0x7D2F, 0x7D3A, 0x7D44, 0x7D4E, 0x7D58, 0x7D63, 0x7D6D, 0x7D77, 0x7D81, 0x7D8A, 0x7D94, 0x7D9E, 0x7DA7
+    .half 0x7DB1, 0x7DBA, 0x7DC4, 0x7DCD, 0x7DD6, 0x7DE0, 0x7DE9, 0x7DF2, 0x7DFB, 0x7E03, 0x7E0C, 0x7E15, 0x7E1E, 0x7E26, 0x7E2F
+    .half 0x7E37, 0x7E3F, 0x7E48, 0x7E50, 0x7E58, 0x7E60, 0x7E68, 0x7E70, 0x7E78, 0x7E7F, 0x7E87, 0x7E8E, 0x7E96, 0x7E9D, 0x7EA5
+    .half 0x7EAC, 0x7EB3, 0x7EBA, 0x7EC1, 0x7EC8, 0x7ECF, 0x7ED6, 0x7EDD, 0x7EE3, 0x7EEA, 0x7EF0, 0x7EF7, 0x7EFD, 0x7F03, 0x7F0A
+    .half 0x7F10, 0x7F16, 0x7F1C, 0x7F22, 0x7F27, 0x7F2D, 0x7F33, 0x7F38, 0x7F3E, 0x7F43, 0x7F49, 0x7F4E, 0x7F53, 0x7F58, 0x7F5D
+    .half 0x7F62, 0x7F67, 0x7F6C, 0x7F71, 0x7F75, 0x7F7A, 0x7F7E, 0x7F83, 0x7F87, 0x7F8B, 0x7F90, 0x7F94, 0x7F98, 0x7F9C, 0x7FA0
+    .half 0x7FA3, 0x7FA7, 0x7FAB, 0x7FAE, 0x7FB2, 0x7FB5, 0x7FB9, 0x7FBC, 0x7FBF, 0x7FC2, 0x7FC5, 0x7FC8, 0x7FCB, 0x7FCE, 0x7FD1
+    .half 0x7FD3, 0x7FD6, 0x7FD9, 0x7FDB, 0x7FDD, 0x7FE0, 0x7FE2, 0x7FE4, 0x7FE6, 0x7FE8, 0x7FEA, 0x7FEC, 0x7FED, 0x7FEF, 0x7FF1
+    .half 0x7FF2, 0x7FF4, 0x7FF5, 0x7FF6, 0x7FF7, 0x7FF8, 0x7FF9, 0x7FFA, 0x7FFB, 0x7FFC, 0x7FFD, 0x7FFE, 0x7FFE, 0x7FFF, 0x7FFF
+    .half 0x7FFF, 0x8000, 0x8000, 0x8000, 0x8000
+
+/* 1025 unsigned 16 bit integer values 0-1024 */
+EXPORT(gArcTanTable)
+    .half 0x0000, 0x000A, 0x0014, 0x001F, 0x0029, 0x0033, 0x003D, 0x0047, 0x0051, 0x005C, 0x0066, 0x0070, 0x007A, 0x0084, 0x008F
+    .half 0x0099, 0x00A3, 0x00AD, 0x00B7, 0x00C2, 0x00CC, 0x00D6, 0x00E0, 0x00EA, 0x00F4, 0x00FF, 0x0109, 0x0113, 0x011D, 0x0127
+    .half 0x0131, 0x013C, 0x0146, 0x0150, 0x015A, 0x0164, 0x016F, 0x0179, 0x0183, 0x018D, 0x0197, 0x01A1, 0x01AC, 0x01B6, 0x01C0
+    .half 0x01CA, 0x01D4, 0x01DE, 0x01E9, 0x01F3, 0x01FD, 0x0207, 0x0211, 0x021B, 0x0226, 0x0230, 0x023A, 0x0244, 0x024E, 0x0258
+    .half 0x0262, 0x026D, 0x0277, 0x0281, 0x028B, 0x0295, 0x029F, 0x02A9, 0x02B4, 0x02BE, 0x02C8, 0x02D2, 0x02DC, 0x02E6, 0x02F0
+    .half 0x02FB, 0x0305, 0x030F, 0x0319, 0x0323, 0x032D, 0x0337, 0x0341, 0x034C, 0x0356, 0x0360, 0x036A, 0x0374, 0x037E, 0x0388
+    .half 0x0392, 0x039C, 0x03A7, 0x03B1, 0x03BB, 0x03C5, 0x03CF, 0x03D9, 0x03E3, 0x03ED, 0x03F7, 0x0401, 0x040C, 0x0416, 0x0420
+    .half 0x042A, 0x0434, 0x043E, 0x0448, 0x0452, 0x045C, 0x0466, 0x0470, 0x047A, 0x0484, 0x048E, 0x0499, 0x04A3, 0x04AD, 0x04B7
+    .half 0x04C1, 0x04CB, 0x04D5, 0x04DF, 0x04E9, 0x04F3, 0x04FD, 0x0507, 0x0511, 0x051B, 0x0525, 0x052F, 0x0539, 0x0543, 0x054D
+    .half 0x0557, 0x0561, 0x056B, 0x0575, 0x057F, 0x0589, 0x0593, 0x059D, 0x05A7, 0x05B1, 0x05BB, 0x05C5, 0x05CF, 0x05D9, 0x05E3
+    .half 0x05ED, 0x05F7, 0x0601, 0x060B, 0x0615, 0x061F, 0x0629, 0x0633, 0x063D, 0x0647, 0x0651, 0x065B, 0x0665, 0x066E, 0x0678
+    .half 0x0682, 0x068C, 0x0696, 0x06A0, 0x06AA, 0x06B4, 0x06BE, 0x06C8, 0x06D2, 0x06DC, 0x06E5, 0x06EF, 0x06F9, 0x0703, 0x070D
+    .half 0x0717, 0x0721, 0x072B, 0x0735, 0x073E, 0x0748, 0x0752, 0x075C, 0x0766, 0x0770, 0x077A, 0x0783, 0x078D, 0x0797, 0x07A1
+    .half 0x07AB, 0x07B5, 0x07BE, 0x07C8, 0x07D2, 0x07DC, 0x07E6, 0x07EF, 0x07F9, 0x0803, 0x080D, 0x0817, 0x0820, 0x082A, 0x0834
+    .half 0x083E, 0x0848, 0x0851, 0x085B, 0x0865, 0x086F, 0x0878, 0x0882, 0x088C, 0x0896, 0x089F, 0x08A9, 0x08B3, 0x08BD, 0x08C6
+    .half 0x08D0, 0x08DA, 0x08E3, 0x08ED, 0x08F7, 0x0901, 0x090A, 0x0914, 0x091E, 0x0927, 0x0931, 0x093B, 0x0944, 0x094E, 0x0958
+    .half 0x0961, 0x096B, 0x0975, 0x097E, 0x0988, 0x0992, 0x099B, 0x09A5, 0x09AE, 0x09B8, 0x09C2, 0x09CB, 0x09D5, 0x09DE, 0x09E8
+    .half 0x09F2, 0x09FB, 0x0A05, 0x0A0E, 0x0A18, 0x0A22, 0x0A2B, 0x0A35, 0x0A3E, 0x0A48, 0x0A51, 0x0A5B, 0x0A64, 0x0A6E, 0x0A77
+    .half 0x0A81, 0x0A8B, 0x0A94, 0x0A9E, 0x0AA7, 0x0AB1, 0x0ABA, 0x0AC4, 0x0ACD, 0x0AD7, 0x0AE0, 0x0AE9, 0x0AF3, 0x0AFC, 0x0B06
+    .half 0x0B0F, 0x0B19, 0x0B22, 0x0B2C, 0x0B35, 0x0B3F, 0x0B48, 0x0B51, 0x0B5B, 0x0B64, 0x0B6E, 0x0B77, 0x0B80, 0x0B8A, 0x0B93
+    .half 0x0B9D, 0x0BA6, 0x0BAF, 0x0BB9, 0x0BC2, 0x0BCB, 0x0BD5, 0x0BDE, 0x0BE7, 0x0BF1, 0x0BFA, 0x0C03, 0x0C0D, 0x0C16, 0x0C1F
+    .half 0x0C29, 0x0C32, 0x0C3B, 0x0C45, 0x0C4E, 0x0C57, 0x0C60, 0x0C6A, 0x0C73, 0x0C7C, 0x0C86, 0x0C8F, 0x0C98, 0x0CA1, 0x0CAB
+    .half 0x0CB4, 0x0CBD, 0x0CC6, 0x0CCF, 0x0CD9, 0x0CE2, 0x0CEB, 0x0CF4, 0x0CFD, 0x0D07, 0x0D10, 0x0D19, 0x0D22, 0x0D2B, 0x0D34
+    .half 0x0D3E, 0x0D47, 0x0D50, 0x0D59, 0x0D62, 0x0D6B, 0x0D74, 0x0D7D, 0x0D87, 0x0D90, 0x0D99, 0x0DA2, 0x0DAB, 0x0DB4, 0x0DBD
+    .half 0x0DC6, 0x0DCF, 0x0DD8, 0x0DE1, 0x0DEA, 0x0DF3, 0x0DFC, 0x0E05, 0x0E0F, 0x0E18, 0x0E21, 0x0E2A, 0x0E33, 0x0E3C, 0x0E45
+    .half 0x0E4E, 0x0E56, 0x0E5F, 0x0E68, 0x0E71, 0x0E7A, 0x0E83, 0x0E8C, 0x0E95, 0x0E9E, 0x0EA7, 0x0EB0, 0x0EB9, 0x0EC2, 0x0ECB
+    .half 0x0ED4, 0x0EDC, 0x0EE5, 0x0EEE, 0x0EF7, 0x0F00, 0x0F09, 0x0F12, 0x0F1B, 0x0F23, 0x0F2C, 0x0F35, 0x0F3E, 0x0F47, 0x0F50
+    .half 0x0F58, 0x0F61, 0x0F6A, 0x0F73, 0x0F7C, 0x0F84, 0x0F8D, 0x0F96, 0x0F9F, 0x0FA7, 0x0FB0, 0x0FB9, 0x0FC2, 0x0FCA, 0x0FD3
+    .half 0x0FDC, 0x0FE5, 0x0FED, 0x0FF6, 0x0FFF, 0x1007, 0x1010, 0x1019, 0x1021, 0x102A, 0x1033, 0x103B, 0x1044, 0x104D, 0x1055
+    .half 0x105E, 0x1067, 0x106F, 0x1078, 0x1080, 0x1089, 0x1092, 0x109A, 0x10A3, 0x10AB, 0x10B4, 0x10BC, 0x10C5, 0x10CE, 0x10D6
+    .half 0x10DF, 0x10E7, 0x10F0, 0x10F8, 0x1101, 0x1109, 0x1112, 0x111A, 0x1123, 0x112B, 0x1134, 0x113C, 0x1145, 0x114D, 0x1156
+    .half 0x115E, 0x1166, 0x116F, 0x1177, 0x1180, 0x1188, 0x1191, 0x1199, 0x11A1, 0x11AA, 0x11B2, 0x11BB, 0x11C3, 0x11CB, 0x11D4
+    .half 0x11DC, 0x11E4, 0x11ED, 0x11F5, 0x11FD, 0x1206, 0x120E, 0x1216, 0x121F, 0x1227, 0x122F, 0x1237, 0x1240, 0x1248, 0x1250
+    .half 0x1259, 0x1261, 0x1269, 0x1271, 0x127A, 0x1282, 0x128A, 0x1292, 0x129A, 0x12A3, 0x12AB, 0x12B3, 0x12BB, 0x12C3, 0x12CC
+    .half 0x12D4, 0x12DC, 0x12E4, 0x12EC, 0x12F4, 0x12FC, 0x1305, 0x130D, 0x1315, 0x131D, 0x1325, 0x132D, 0x1335, 0x133D, 0x1345
+    .half 0x134D, 0x1355, 0x135E, 0x1366, 0x136E, 0x1376, 0x137E, 0x1386, 0x138E, 0x1396, 0x139E, 0x13A6, 0x13AE, 0x13B6, 0x13BE
+    .half 0x13C6, 0x13CE, 0x13D6, 0x13DE, 0x13E6, 0x13ED, 0x13F5, 0x13FD, 0x1405, 0x140D, 0x1415, 0x141D, 0x1425, 0x142D, 0x1435
+    .half 0x143D, 0x1444, 0x144C, 0x1454, 0x145C, 0x1464, 0x146C, 0x1473, 0x147B, 0x1483, 0x148B, 0x1493, 0x149B, 0x14A2, 0x14AA
+    .half 0x14B2, 0x14BA, 0x14C1, 0x14C9, 0x14D1, 0x14D9, 0x14E0, 0x14E8, 0x14F0, 0x14F8, 0x14FF, 0x1507, 0x150F, 0x1516, 0x151E
+    .half 0x1526, 0x152D, 0x1535, 0x153D, 0x1544, 0x154C, 0x1554, 0x155B, 0x1563, 0x156B, 0x1572, 0x157A, 0x1581, 0x1589, 0x1591
+    .half 0x1598, 0x15A0, 0x15A7, 0x15AF, 0x15B7, 0x15BE, 0x15C6, 0x15CD, 0x15D5, 0x15DC, 0x15E4, 0x15EB, 0x15F3, 0x15FA, 0x1602
+    .half 0x1609, 0x1611, 0x1618, 0x1620, 0x1627, 0x162F, 0x1636, 0x163E, 0x1645, 0x164C, 0x1654, 0x165B, 0x1663, 0x166A, 0x1671
+    .half 0x1679, 0x1680, 0x1688, 0x168F, 0x1696, 0x169E, 0x16A5, 0x16AC, 0x16B4, 0x16BB, 0x16C2, 0x16CA, 0x16D1, 0x16D8, 0x16E0
+    .half 0x16E7, 0x16EE, 0x16F6, 0x16FD, 0x1704, 0x170B, 0x1713, 0x171A, 0x1721, 0x1728, 0x1730, 0x1737, 0x173E, 0x1745, 0x174C
+    .half 0x1754, 0x175B, 0x1762, 0x1769, 0x1770, 0x1778, 0x177F, 0x1786, 0x178D, 0x1794, 0x179B, 0x17A2, 0x17AA, 0x17B1, 0x17B8
+    .half 0x17BF, 0x17C6, 0x17CD, 0x17D4, 0x17DB, 0x17E2, 0x17E9, 0x17F0, 0x17F7, 0x17FE, 0x1806, 0x180D, 0x1814, 0x181B, 0x1822
+    .half 0x1829, 0x1830, 0x1837, 0x183E, 0x1845, 0x184C, 0x1853, 0x185A, 0x1860, 0x1867, 0x186E, 0x1875, 0x187C, 0x1883, 0x188A
+    .half 0x1891, 0x1898, 0x189F, 0x18A6, 0x18AD, 0x18B3, 0x18BA, 0x18C1, 0x18C8, 0x18CF, 0x18D6, 0x18DD, 0x18E3, 0x18EA, 0x18F1
+    .half 0x18F8, 0x18FF, 0x1906, 0x190C, 0x1913, 0x191A, 0x1921, 0x1928, 0x192E, 0x1935, 0x193C, 0x1943, 0x1949, 0x1950, 0x1957
+    .half 0x195D, 0x1964, 0x196B, 0x1972, 0x1978, 0x197F, 0x1986, 0x198C, 0x1993, 0x199A, 0x19A0, 0x19A7, 0x19AE, 0x19B4, 0x19BB
+    .half 0x19C2, 0x19C8, 0x19CF, 0x19D5, 0x19DC, 0x19E3, 0x19E9, 0x19F0, 0x19F6, 0x19FD, 0x1A04, 0x1A0A, 0x1A11, 0x1A17, 0x1A1E
+    .half 0x1A24, 0x1A2B, 0x1A31, 0x1A38, 0x1A3E, 0x1A45, 0x1A4B, 0x1A52, 0x1A58, 0x1A5F, 0x1A65, 0x1A6C, 0x1A72, 0x1A79, 0x1A7F
+    .half 0x1A86, 0x1A8C, 0x1A93, 0x1A99, 0x1A9F, 0x1AA6, 0x1AAC, 0x1AB3, 0x1AB9, 0x1AC0, 0x1AC6, 0x1ACC, 0x1AD3, 0x1AD9, 0x1ADF
+    .half 0x1AE6, 0x1AEC, 0x1AF2, 0x1AF9, 0x1AFF, 0x1B05, 0x1B0C, 0x1B12, 0x1B18, 0x1B1F, 0x1B25, 0x1B2B, 0x1B32, 0x1B38, 0x1B3E
+    .half 0x1B44, 0x1B4B, 0x1B51, 0x1B57, 0x1B5D, 0x1B64, 0x1B6A, 0x1B70, 0x1B76, 0x1B7D, 0x1B83, 0x1B89, 0x1B8F, 0x1B95, 0x1B9C
+    .half 0x1BA2, 0x1BA8, 0x1BAE, 0x1BB4, 0x1BBA, 0x1BC1, 0x1BC7, 0x1BCD, 0x1BD3, 0x1BD9, 0x1BDF, 0x1BE5, 0x1BEB, 0x1BF2, 0x1BF8
+    .half 0x1BFE, 0x1C04, 0x1C0A, 0x1C10, 0x1C16, 0x1C1C, 0x1C22, 0x1C28, 0x1C2E, 0x1C34, 0x1C3A, 0x1C40, 0x1C46, 0x1C4C, 0x1C52
+    .half 0x1C58, 0x1C5E, 0x1C64, 0x1C6A, 0x1C70, 0x1C76, 0x1C7C, 0x1C82, 0x1C88, 0x1C8E, 0x1C94, 0x1C9A, 0x1CA0, 0x1CA6, 0x1CAC
+    .half 0x1CB2, 0x1CB8, 0x1CBE, 0x1CC3, 0x1CC9, 0x1CCF, 0x1CD5, 0x1CDB, 0x1CE1, 0x1CE7, 0x1CED, 0x1CF3, 0x1CF8, 0x1CFE, 0x1D04
+    .half 0x1D0A, 0x1D10, 0x1D16, 0x1D1B, 0x1D21, 0x1D27, 0x1D2D, 0x1D33, 0x1D38, 0x1D3E, 0x1D44, 0x1D4A, 0x1D4F, 0x1D55, 0x1D5B
+    .half 0x1D61, 0x1D66, 0x1D6C, 0x1D72, 0x1D78, 0x1D7D, 0x1D83, 0x1D89, 0x1D8E, 0x1D94, 0x1D9A, 0x1DA0, 0x1DA5, 0x1DAB, 0x1DB1
+    .half 0x1DB6, 0x1DBC, 0x1DC2, 0x1DC7, 0x1DCD, 0x1DD3, 0x1DD8, 0x1DDE, 0x1DE3, 0x1DE9, 0x1DEF, 0x1DF4, 0x1DFA, 0x1DFF, 0x1E05
+    .half 0x1E0B, 0x1E10, 0x1E16, 0x1E1B, 0x1E21, 0x1E26, 0x1E2C, 0x1E32, 0x1E37, 0x1E3D, 0x1E42, 0x1E48, 0x1E4D, 0x1E53, 0x1E58
+    .half 0x1E5E, 0x1E63, 0x1E69, 0x1E6E, 0x1E74, 0x1E79, 0x1E7F, 0x1E84, 0x1E8A, 0x1E8F, 0x1E94, 0x1E9A, 0x1E9F, 0x1EA5, 0x1EAA
+    .half 0x1EB0, 0x1EB5, 0x1EBA, 0x1EC0, 0x1EC5, 0x1ECB, 0x1ED0, 0x1ED5, 0x1EDB, 0x1EE0, 0x1EE6, 0x1EEB, 0x1EF0, 0x1EF6, 0x1EFB
+    .half 0x1F00, 0x1F06, 0x1F0B, 0x1F10, 0x1F16, 0x1F1B, 0x1F20, 0x1F26, 0x1F2B, 0x1F30, 0x1F36, 0x1F3B, 0x1F40, 0x1F45, 0x1F4B
+    .half 0x1F50, 0x1F55, 0x1F5A, 0x1F60, 0x1F65, 0x1F6A, 0x1F6F, 0x1F75, 0x1F7A, 0x1F7F, 0x1F84, 0x1F8A, 0x1F8F, 0x1F94, 0x1F99
+    .half 0x1F9E, 0x1FA4, 0x1FA9, 0x1FAE, 0x1FB3, 0x1FB8, 0x1FBD, 0x1FC3, 0x1FC8, 0x1FCD, 0x1FD2, 0x1FD7, 0x1FDC, 0x1FE1, 0x1FE6
+    .half 0x1FEC, 0x1FF1, 0x1FF6, 0x1FFB, 0x2000
+
+
+.text
+
+/* Official Name: disableInterrupts */
+LEAF(interrupts_disable)
+    lb         t0, gIntDisFlag
+    .set noreorder
+    beqz       t0, .L8006F534
+    .set reorder
+    MFC0(      t0, C0_SR)
+    and        t1, t0, -2
+    MTC0(      t1, C0_SR)
+    andi       v0, t0, 0x1
+    NOP
+    .L8006F534:
+    jr         ra
+END(interrupts_disable)
+
+/* Official Name: enableInterrupts */
+LEAF(interrupts_enable)
+    lb         t0, gIntDisFlag
+    .set noreorder
+    beqz       t0, .L8006F55C
+    .set reorder
+    MFC0(      t0, C0_SR)
+    or         t0, t0, a0
+    MTC0(      t0, C0_SR)
+    NOP
+    NOP
+    .L8006F55C:
+    jr         ra
+END(interrupts_enable)
+
+/* Official Name: setIntDisFlag */
+LEAF(set_gIntDisFlag)
+    sb         a0, gIntDisFlag
+    jr         ra
+END(set_gIntDisFlag)
+
+/* Official Name: getIntDisFlag */
+LEAF(get_gIntDisFlag)
+    lbu        v0, gIntDisFlag
+    jr         ra
+END(get_gIntDisFlag)
+
+LEAF(mtx_to_mtxs)
+ori        t0, zero, 0x4
+lui        t7, 0xFFFF
+.L8006F584:
+lw         t1, 0x0(a0)
+lw         t2, 0x20(a0)
+lw         t3, 0x4(a0)
+lw         t4, 0x24(a0)
+sh         t1, 0x4(a2)
+sh         t2, 0x6(a2)
+sh         t3, 0xC(a2)
+sh         t4, 0xE(a2)
+srl        t1, t1, 16
+srl        t2, t2, 16
+srl        t3, t3, 16
+srl        t4, t4, 16
+addiu      a0, a0, 0x8
+sh         t1, 0x0(a2)
+sh         t2, 0x2(a2)
+sh         t3, 0x8(a2)
+sh         t4, 0xA(a2)
+addi       a2, a2, 0x10
+addiu      t0, t0, -0x1
+bnel       t0, zero, .L8006F584
+ NOP
+jr         ra
+ NOP
+END(mtx_to_mtxs)
+
+LEAF(mtxf_to_mtxs)
+li.s       AT, 65536.0
+mtc1       AT, fa0
+ori        t0, zero, 0x4
+.L8006F5EC:
+lwc1       ft0, 0x0(a0)
+lwc1       ft1, 0x4(a0)
+lwc1       ft2, 0x8(a0)
+mul.s      ft0, ft0, fa0
+lwc1       ft3, 0xC(a0)
+addiu      a0, a0, 0x10
+mul.s      ft1, ft1, fa0
+addiu      t0, t0, -0x1
+addiu      a2, a2, 0x10
+mul.s      ft2, ft2, fa0
+NOP
+mul.s      ft3, ft3, fa0
+trunc.w.s  ft0, ft0
+trunc.w.s  ft1, ft1
+swc1       ft0, -0x10(a2)
+trunc.w.s  ft2, ft2
+swc1       ft1, -0xC(a2)
+trunc.w.s  ft3, ft3
+swc1       ft2, -0x8(a2)
+swc1       ft3, -0x4(a2)
+bnel       t0, zero, .L8006F5EC
+ NOP
+jr         ra
+ NOP
+END(mtxf_to_mtxs)
+
+/* Official Name: mathMtxXFMF */
+LEAF(mtxf_transform_point)
+mtc1       a2, fa0
+lwc1       ft0, 0x0(a0)
+mtc1       a2, fa1
+lwc1       ft2, 0x10(a0)
+mul.s      ft1, ft0, fa0
+mtc1       a3, ft4
+lwc1       ft0, 0x20(a0)
+mul.s      ft3, ft2, fa1
+lw         t6, 0x10(sp)
+mul.s      ft2, ft0, ft4
+add.s      ft5, ft1, ft3
+lwc1       ft3, 0x30(a0)
+add.s      ft1, ft5, ft2
+add.s      ft0, ft3, ft1
+swc1       ft0, 0x0(t6)
+lwc1       ft5, 0x4(a0)
+lwc1       ft3, 0x14(a0)
+lw         t7, 0x14(sp)
+mul.s      ft2, ft5, fa0
+lwc1       ft5, 0x24(a0)
+mul.s      ft1, ft3, fa1
+add.s      ft0, ft2, ft1
+mul.s      ft3, ft5, ft4
+lwc1       ft1, 0x34(a0)
+add.s      ft2, ft0, ft3
+add.s      ft5, ft1, ft2
+swc1       ft5, 0x0(t7)
+lwc1       ft0, 0x8(a0)
+lwc1       ft1, 0x18(a0)
+lw         t8, 0x18(sp)
+mul.s      ft3, ft0, fa0
+lwc1       ft0, 0x28(a0)
+mul.s      ft2, ft1, fa1
+add.s      ft5, ft3, ft2
+mul.s      ft1, ft0, ft4
+lwc1       ft2, 0x38(a0)
+add.s      ft3, ft5, ft1
+add.s      ft0, ft2, ft3
+jr         ra
+ swc1      ft0, 0x0(t8)
+END(mtxf_transform_point)
+
+/* Official Name: mathMtxFastXFMF */
+LEAF(mtxf_transform_dir)
+lwc1       ft0, 0x0(a2)
+lwc1       ft3, 0x0(a0)
+lwc1       ft1, 0x4(a2)
+lwc1       fa0, 0x10(a0)
+mul.s      ft3, ft0, ft3
+lwc1       ft2, 0x8(a2)
+lwc1       fa1, 0x20(a0)
+mul.s      fa0, ft1, fa0
+add.s      fa0, ft3, fa0
+mul.s      fa1, ft2, fa1
+lwc1       ft3, 0x4(a0)
+mul.s      ft3, ft0, ft3
+add.s      ft4, fa0, fa1
+lwc1       fa0, 0x14(a0)
+lwc1       fa1, 0x24(a0)
+mul.s      fa0, ft1, fa0
+swc1       ft4, 0x0(a2)
+mul.s      fa1, ft2, fa1
+add.s      fa0, ft3, fa0
+lwc1       ft3, 0x8(a0)
+add.s      ft4, fa0, fa1
+mul.s      ft3, ft0, ft3
+lwc1       fa0, 0x18(a0)
+lwc1       fa1, 0x28(a0)
+swc1       ft4, 0x4(a2)
+mul.s      fa0, ft1, fa0
+add.s      fa0, ft3, fa0
+mul.s      fa1, ft2, fa1
+add.s      fa1, fa0, fa1
+jr         ra
+ swc1      fa1, 0x8(a2)
+END(mtxf_transform_dir)
+
+/* Official Name: mathMtxCatF */
+LEAF(mtxf_mul)
+addiu      sp, sp, -0x8
+sdc1       fv1, 0x0(sp)
+ori        t0, zero, 0x4
+.L8006F774:
+lwc1       fv1, 0x0(a0)
+lwc1       ft3, 0x0(a2)
+lwc1       ft0, 0x4(a0)
+lwc1       fa0, 0x10(a2)
+mul.s      ft3, fv1, ft3
+lwc1       ft1, 0x8(a0)
+lwc1       fa1, 0x20(a2)
+mul.s      fa0, ft0, fa0
+lwc1       ft2, 0xC(a0)
+lwc1       ft4, 0x30(a2)
+mul.s      fa1, ft1, fa1
+addiu      a0, a0, 0x10
+addiu      a2, a2, 0x10
+mul.s      ft4, ft2, ft4
+addiu      t0, t0, -0x1
+add.s      fa1, fa0, fa1
+lwc1       fa0, 0x14(a2)
+add.s      ft4, ft3, ft4
+lwc1       ft3, 0x4(a2)
+mul.s      ft3, fv1, ft3
+add.s      ft5, fa1, ft4
+lwc1       fa1, 0x24(a2)
+mul.s      fa0, ft0, fa0
+lwc1       ft4, 0x34(a2)
+swc1       ft5, -0x10(a2)
+mul.s      fa1, ft1, fa1
+NOP
+mul.s      ft4, ft2, ft4
+add.s      fa1, fa0, fa1
+lwc1       fa0, 0x18(a2)
+add.s      ft4, ft3, ft4
+lwc1       ft3, 0x8(a2)
+mul.s      ft3, fv1, ft3
+add.s      ft5, fa1, ft4
+lwc1       fa1, 0x28(a2)
+mul.s      fa0, ft0, fa0
+lwc1       ft4, 0x38(a2)
+swc1       ft5, -0xC(a2)
+mul.s      fa1, ft1, fa1
+NOP
+mul.s      ft4, ft2, ft4
+add.s      fa1, fa0, fa1
+lwc1       fa0, 0x1C(a2)
+add.s      ft4, ft3, ft4
+lwc1       ft3, 0xC(a2)
+mul.s      ft3, fv1, ft3
+add.s      ft5, fa1, ft4
+lwc1       fa1, 0x2C(a2)
+mul.s      fa0, ft0, fa0
+lwc1       ft4, 0x3C(a2)
+swc1       ft5, -0x8(a2)
+mul.s      fa1, ft1, fa1
+NOP
+mul.s      ft4, ft2, ft4
+add.s      fa1, fa0, fa1
+add.s      ft4, ft3, ft4
+add.s      ft5, fa1, ft4
+swc1       ft5, -0x4(a2)
+bnel       t0, zero, .L8006F774
+ NOP
+ldc1       fv1, 0x0(sp)
+jr         ra
+ addiu     sp, sp, 0x8
+END(mtxf_mul)
+
+/* Official Name: mathMtxF2L */
+LEAF(mtxf_to_mtx)
+li.s       AT, 65536.0
+mtc1       AT, fa0
+ori        t0, zero, 0x4
+.L8006F87C:
+lwc1       ft0, 0x0(a0)
+lwc1       ft1, 0x4(a0)
+lwc1       ft2, 0x8(a0)
+mul.s      ft0, ft0, fa0
+lwc1       ft3, 0xC(a0)
+addiu      a0, a0, 0x10
+mul.s      ft1, ft1, fa0
+addiu      a2, a2, 0x8
+addiu      t0, t0, -0x1
+mul.s      ft2, ft2, fa0
+NOP
+mul.s      ft3, ft3, fa0
+cvt.w.s    ft0, ft0
+cvt.w.s    ft1, ft1
+mfc1       t1, ft0
+cvt.w.s    ft2, ft2
+mfc1       t2, ft1
+sh         t1, 0x18(a2)
+cvt.w.s    ft3, ft3
+mfc1       t3, ft2
+sh         t2, 0x1A(a2)
+srl        t1, t1, 16
+mfc1       t4, ft3
+sh         t3, 0x1C(a2)
+srl        t2, t2, 16
+sh         t4, 0x1E(a2)
+srl        t3, t3, 16
+srl        t4, t4, 16
+sh         t1, -0x8(a2)
+sh         t2, -0x6(a2)
+sh         t3, -0x4(a2)
+sh         t4, -0x2(a2)
+bnel       t0, zero, .L8006F87C
+ NOP
+jr         ra
+ NOP
+END(mtxf_to_mtx)
+
+/* Official Name: mathSeed */
+LEAF(set_rng_seed)
+lui        AT, %hi(gCurrentRNGSeed)
+jr         ra
+ sw        a0, %lo(gCurrentRNGSeed)(AT)
+END(set_rng_seed)
+
+LEAF(save_rng_seed)
+lui        a0, %hi(gCurrentRNGSeed)
+lw         a0, %lo(gCurrentRNGSeed)(a0)
+lui        AT, %hi(gPrevRNGSeed)
+jr         ra
+ sw        a0, %lo(gPrevRNGSeed)(AT)
+END(save_rng_seed)
+
+LEAF(load_rng_seed)
+lui        a0, %hi(gPrevRNGSeed)
+lw         a0, %lo(gPrevRNGSeed)(a0)
+lui        AT, %hi(gCurrentRNGSeed)
+jr         ra
+ sw        a0, %lo(gCurrentRNGSeed)(AT)
+END(load_rng_seed)
+
+LEAF(get_rng_seed)
+lui        v0, %hi(gCurrentRNGSeed)
+jr         ra
+ lw        v0, %lo(gCurrentRNGSeed)(v0)
+END(get_rng_seed)
+
+/* Official Name: mathRnd */
+LEAF(rand_range)
+lui        t0, %hi(gCurrentRNGSeed)
+lw         t0, %lo(gCurrentRNGSeed)(t0)
+lui        AT, %hi(gCurrentRNGSeed)
+sub        a2, a2, a0
+dsll32     t1, t0, 31
+dsll       t2, t0, 31
+dsrl       t1, t1, 31
+dsrl32     t2, t2, 0
+dsll32     t3, t0, 12
+or         t1, t1, t2
+dsrl32     t3, t3, 0
+xor        t1, t1, t3
+dsrl       t3, t1, 20
+andi       t3, t3, 0xFFF
+xor        t0, t3, t1
+sw         t0, %lo(gCurrentRNGSeed)(AT)
+addi       a2, a2, 0x1
+subu       t0, t0, a0
+divu       zero, t0, a2
+mflo       t0
+mfhi       v0
+add        v0, v0, a0
+bnez       a2, .L8006F9B0
+ NOP
+break      7
+.L8006F9B0:
+jr         ra
+ NOP
+END(rand_range)
+
+/* Official Name: fastShortReflection */
+LEAF(vec3s_reflect)
+lh         t0, 0x0(a0)
+lh         t3, 0x0(a2)
+lh         t1, 0x2(a0)
+lh         t4, 0x2(a2)
+mult       t0, t3
+lh         t2, 0x4(a0)
+lh         t5, 0x4(a2)
+mflo       t6
+NOP
+NOP
+mult       t1, t4
+mflo       t7
+add        t6, t6, t7
+NOP
+mult       t2, t5
+mflo       t8
+add        t6, t6, t8
+sra        t6, t6, 12
+mult       t6, t3
+mflo       t3
+sra        t3, t3, 13
+sub        t3, t3, t0
+mult       t6, t4
+sh         t3, 0x6(a0)
+mflo       t4
+sra        t4, t4, 13
+sub        t4, t4, t1
+mult       t6, t5
+sh         t4, 0x8(a0)
+mflo       t5
+sra        t5, t5, 13
+sub        t5, t5, t0
+jr         ra
+ sh        t5, 0xA(a0)
+END(vec3s_reflect)
+
+LEAF(mtx_to_mtxs_2)
+ori        t2, zero, 0x10
+xor        t3, t3, t3
+.L8006FA48:
+lh         t0, 0x0(a0)
+lhu        t1, 0x20(a0)
+addi       a0, a0, 0x2
+sll        t0, t0, 16
+or         t0, t0, t1
+sw         t0, 0x0(a2)
+addi       a2, a2, 0x4
+addiu      t3, t3, 0x1
+bnel       t3, t2, .L8006FA48
+ NOP
+jr         ra
+ NOP
+END(mtx_to_mtxs_2)
+
+LEAF(mtxs_transform_point)
+lh         t0, 0x0(a2)
+lw         t3, 0x0(a0)
+lh         t1, 0x2(a2)
+lh         t2, 0x4(a2)
+mult       t0, t3
+lw         t3, 0x10(a0)
+mflo       t4
+NOP
+NOP
+mult       t1, t3
+lw         t3, 0x20(a0)
+mflo       t5
+add        t4, t4, t5
+NOP
+mult       t2, t3
+lw         t3, 0x30(a0)
+mflo       t6
+add        t4, t4, t6
+add        t4, t4, t3
+sra        t4, t4, 16
+sh         t4, 0x0(a2)
+lw         t3, 0x4(a0)
+mult       t0, t3
+lw         t3, 0x14(a0)
+mflo       t4
+NOP
+NOP
+mult       t1, t3
+lw         t3, 0x24(a0)
+mflo       t5
+add        t4, t4, t5
+NOP
+mult       t2, t3
+lw         t3, 0x34(a0)
+mflo       t6
+add        t4, t4, t6
+add        t4, t4, t3
+sra        t4, t4, 16
+sh         t4, 0x2(a2)
+lw         t3, 0x8(a0)
+mult       t0, t3
+lw         t3, 0x18(a0)
+mflo       t4
+NOP
+NOP
+mult       t1, t3
+lw         t3, 0x28(a0)
+mflo       t5
+add        t4, t4, t5
+NOP
+mult       t2, t3
+lw         t3, 0x38(a0)
+mflo       t6
+add        t4, t4, t6
+add        t4, t4, t3
+sra        t4, t4, 16
+jr         ra
+ sh        t4, 0x4(a2)
+END(mtxs_transform_point)
+
+LEAF(mtxs_transform_dir)
+lw         t3, 0x0(a0)
+lh         t0, 0x0(a2)
+lh         t1, 0x2(a2)
+lh         t2, 0x4(a2)
+mult       t0, t3
+lw         t3, 0x10(a0)
+mflo       t4
+NOP
+NOP
+mult       t1, t3
+lw         t3, 0x20(a0)
+mflo       t5
+add        t4, t4, t5
+NOP
+mult       t2, t3
+lw         t3, 0x4(a0)
+mflo       t6
+add        t4, t4, t6
+sra        t4, t4, 16
+mult       t0, t3
+sh         t4, 0x0(a2)
+lw         t3, 0x14(a0)
+mflo       t4
+NOP
+NOP
+mult       t1, t3
+lw         t3, 0x24(a0)
+mflo       t5
+add        t4, t4, t5
+NOP
+mult       t2, t3
+lw         t3, 0x8(a0)
+mflo       t6
+add        t4, t4, t6
+sra        t4, t4, 16
+mult       t0, t3
+sh         t4, 0x2(a2)
+lw         t3, 0x18(a0)
+mflo       t4
+NOP
+NOP
+mult       t1, t3
+lw         t3, 0x28(a0)
+mflo       t5
+add        t4, t4, t5
+NOP
+mult       t2, t3
+mflo       t6
+add        t4, t4, t6
+sra        t4, t4, 16
+jr         ra
+ sh        t4, 0x4(a2)
+END(mtxs_transform_dir)
+
+LEAF(mtxf_from_transform)
+addiu      sp, sp, -0x8
+li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
+sd         ra, 0x0(sp)
+or         a3, a0, zero
+mtc1       AT, ft5
+jal        sins_s16
+ lh        a0, 0x0(a2)
+mtc1       v0, fv0
+lh         a0, 0x0(a2)
+cvt.s.w    fv0, fv0
+mul.s      fv0, fv0, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, fv1
+lh         a0, 0x2(a2)
+cvt.s.w    fv1, fv1
+mul.s      fv1, fv1, ft5
+jal        sins_s16
+ NOP
+mtc1       v0, ft0
+lh         a0, 0x2(a2)
+cvt.s.w    ft0, ft0
+mul.s      ft0, ft0, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, ft1
+lh         a0, 0x4(a2)
+cvt.s.w    ft1, ft1
+mul.s      ft1, ft1, ft5
+jal        sins_s16
+ NOP
+mtc1       v0, ft2
+lh         a0, 0x4(a2)
+cvt.s.w    ft2, ft2
+mul.s      ft2, ft2, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, ft3
+lw         t2, 0x8(a2)
+sw         zero, 0xC(a3)
+cvt.s.w    ft3, ft3
+sw         zero, 0x1C(a3)
+sw         zero, 0x2C(a3)
+li.s       AT, 1.0
+mul.s      ft3, ft3, ft5
+NOP
+mul.s      ft4, ft0, fv0
+NOP
+mul.s      ft4, ft4, ft2
+NOP
+mul.s      ft5, ft3, fv1
+add.s      ft4, ft4, ft5
+mtc1       t2, ft5
+NOP
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x0(a3)
+mul.s      ft4, ft2, ft1
+NOP
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x4(a3)
+mul.s      ft4, ft0, fv1
+NOP
+mul.s      ft4, ft4, ft2
+NOP
+mul.s      ft5, ft3, fv0
+sub.s      ft4, ft4, ft5
+mtc1       t2, ft5
+NOP
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x8(a3)
+mul.s      ft4, ft0, fv0
+NOP
+mul.s      ft4, ft4, ft3
+NOP
+mul.s      ft5, ft2, fv1
+sub.s      ft4, ft4, ft5
+mtc1       t2, ft5
+NOP
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x10(a3)
+mul.s      ft4, ft3, ft1
+NOP
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x14(a3)
+mul.s      ft4, ft0, fv1
+NOP
+mul.s      ft4, ft4, ft3
+NOP
+mul.s      ft5, ft2, fv0
+add.s      ft4, ft4, ft5
+mtc1       t2, ft5
+NOP
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x18(a3)
+mul.s      ft4, ft1, fv0
+NOP
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x20(a3)
+mul.s      ft4, ft0, ft5
+neg.s      ft4, ft4
+swc1       ft4, 0x24(a3)
+mul.s      ft4, ft1, fv1
+NOP
+mul.s      ft4, ft4, ft5
+mtc1       AT, ft5
+swc1       ft4, 0x28(a3)
+lw         t0, 0xC(a2)
+sw         t0, 0x30(a3)
+lw         t0, 0x10(a2)
+sw         t0, 0x34(a3)
+lw         t0, 0x14(a2)
+swc1       ft5, 0x3C(a3)
+sw         t0, 0x38(a3)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+jr         ra
+ NOP
+END(mtxf_from_transform)
+
+/* Official Name: mathSquashY */
+LEAF(mtxf_scale_y)
+mtc1       a2, ft5
+lwc1       ft4, 0x10(a0)
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x10(a0)
+lwc1       ft4, 0x14(a3)
+mul.s      ft4, ft4, ft5
+swc1       ft4, 0x14(a0)
+lwc1       ft4, 0x18(a0)
+mul.s      ft4, ft4, ft5
+jr         ra
+ swc1      ft4, 0x18(a0)
+END(mtxf_scale_y)
+
+/* Official Name: mathTransY */
+LEAF(mtxf_translate_y)
+mtc1       a2, ft4
+lwc1       fv0, 0x10(a0)
+lwc1       ft0, 0x14(a0)
+lwc1       ft2, 0x18(a0)
+mul.s      fv0, fv0, ft4
+lwc1       fv1, 0x30(a0)
+lwc1       ft1, 0x34(a0)
+mul.s      ft0, ft0, ft4
+lwc1       ft3, 0x38(a0)
+mul.s      ft2, ft2, ft4
+add.s      fv0, fv0, fv1
+add.s      ft0, ft0, ft1
+swc1       fv0, 0x30(a0)
+add.s      ft2, ft2, ft3
+swc1       ft0, 0x34(a0)
+jr         ra
+ swc1      ft2, 0x38(a0)
+END(mtxf_translate_y)
+
+/* Official Name: mathRpyXyzMtx */
+LEAF(mtxf_from_inverse_transform)
+addiu      sp, sp, -0x8
+li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
+sd         ra, 0x0(sp)
+or         a3, a0, zero
+mtc1       AT, ft5
+jal        sins_s16
+ lh        a0, 0x0(a2)
+mtc1       v0, fv0
+lh         a0, 0x0(a2)
+cvt.s.w    fv0, fv0
+mul.s      fv0, fv0, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, fv1
+lh         a0, 0x2(a2)
+cvt.s.w    fv1, fv1
+mul.s      fv1, fv1, ft5
+jal        sins_s16
+ NOP
+mtc1       v0, ft0
+lh         a0, 0x2(a2)
+cvt.s.w    ft0, ft0
+mul.s      ft0, ft0, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, ft1
+lh         a0, 0x4(a2)
+cvt.s.w    ft1, ft1
+mul.s      ft1, ft1, ft5
+jal        sins_s16
+ NOP
+mtc1       v0, ft2
+lh         a0, 0x4(a2)
+cvt.s.w    ft2, ft2
+mul.s      ft2, ft2, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, ft3
+sw         zero, 0xC(a3)
+swc1       ft0, 0x18(a3)
+cvt.s.w    ft3, ft3
+sw         zero, 0x1C(a3)
+sw         zero, 0x2C(a3)
+li.s       AT, 1.0
+mul.s      ft3, ft3, ft5
+NOP
+mul.s      ft4, ft0, ft2
+NOP
+mul.s      ft4, ft4, fv0
+NOP
+mul.s      ft5, fv1, ft3
+sub.s      ft4, ft5, ft4
+swc1       ft4, 0x0(a3)
+mul.s      ft4, ft0, ft3
+NOP
+mul.s      ft4, ft4, fv0
+NOP
+mul.s      ft5, fv1, ft2
+add.s      ft4, ft4, ft5
+swc1       ft4, 0x4(a3)
+mul.s      ft4, fv0, ft1
+neg.s      ft4, ft4
+swc1       ft4, 0x8(a3)
+mul.s      ft4, ft1, ft2
+neg.s      ft4, ft4
+swc1       ft4, 0x10(a3)
+mul.s      ft4, ft1, ft3
+swc1       ft4, 0x14(a3)
+mul.s      ft4, ft0, ft2
+NOP
+mul.s      ft4, ft4, fv1
+NOP
+mul.s      ft5, fv0, ft3
+add.s      ft4, ft4, ft5
+swc1       ft4, 0x20(a3)
+mul.s      ft4, ft0, ft3
+NOP
+mul.s      ft4, ft4, fv1
+NOP
+mul.s      ft5, fv0, ft2
+sub.s      ft4, ft5, ft4
+lwc1       ft5, 0x0(a3)
+swc1       ft4, 0x24(a3)
+mul.s      ft4, fv1, ft1
+swc1       ft4, 0x28(a3)
+lwc1       fv0, 0xC(a2)
+lwc1       fv1, 0x10(a2)
+lwc1       ft4, 0x10(a3)
+mul.s      ft5, ft5, fv0
+lwc1       ft0, 0x14(a2)
+mul.s      ft4, ft4, fv1
+add.s      ft4, ft4, ft5
+lwc1       ft5, 0x20(a3)
+mul.s      ft5, ft5, ft0
+add.s      ft4, ft4, ft5
+lwc1       ft5, 0x4(a3)
+swc1       ft4, 0x30(a3)
+mul.s      ft5, ft5, fv0
+lwc1       ft4, 0x14(a3)
+mul.s      ft4, ft4, fv1
+add.s      ft4, ft4, ft5
+lwc1       ft5, 0x24(a3)
+mul.s      ft5, ft5, ft0
+add.s      ft4, ft4, ft5
+lwc1       ft5, 0x8(a3)
+swc1       ft4, 0x34(a3)
+mul.s      ft5, ft5, fv0
+lwc1       ft4, 0x18(a3)
+mul.s      ft4, ft4, fv1
+add.s      ft4, ft4, ft5
+lwc1       ft5, 0x28(a3)
+mul.s      ft5, ft5, ft0
+add.s      ft4, ft4, ft5
+swc1       ft4, 0x38(a3)
+mtc1       AT, ft4
+NOP
+swc1       ft4, 0x3C(a3)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+jr         ra
+ NOP
+END(mtxf_from_inverse_transform)
+
+LEAF(func_80070058)
+addiu      sp, sp, -0x8
+li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
+sd         ra, 0x0(sp)
+or         a3, a0, zero
+mtc1       AT, ft5
+jal        sins_s16
+ lh        a0, 0x0(a2)
+mtc1       v0, fv0
+lh         a0, 0x0(a2)
+cvt.s.w    fv0, fv0
+mul.s      fv0, fv0, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, fv1
+lh         a0, 0x2(a2)
+cvt.s.w    fv1, fv1
+mul.s      fv1, fv1, ft5
+jal        sins_s16
+ NOP
+mtc1       v0, ft0
+lh         a0, 0x2(a2)
+cvt.s.w    ft0, ft0
+mul.s      ft0, ft0, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, ft1
+lh         a0, 0x4(a2)
+cvt.s.w    ft1, ft1
+mul.s      ft1, ft1, ft5
+jal        sins_s16
+ NOP
+mtc1       v0, ft2
+lh         a0, 0x4(a2)
+cvt.s.w    ft2, ft2
+mul.s      ft2, ft2, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, ft3
+li.s       AT, 1.0
+sw         zero, 0xC(a3)
+cvt.s.w    ft3, ft3
+sw         zero, 0x1C(a3)
+sw         zero, 0x2C(a3)
+mul.s      ft3, ft3, ft5
+mtc1       AT, ft5
+mul.s      fa0, fv0, ft1
+swc1       ft5, 0x3C(a3)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+mul.s      fa1, fv1, ft3
+NOP
+mul.s      ft4, fv0, ft2
+jr         ra
+ NOP
+END(func_80070058)
+
+LEAF(mtxf_billboard)
+addiu      sp, sp, -0x8
+or         t9, a3, zero
+li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
+sd         ra, 0x0(sp)
+or         a3, a0, zero
+mtc1       AT, ft5
+jal        sins_s16
+ or        a0, a2, zero
+mtc1       v0, ft2
+or         a0, a2, zero
+cvt.s.w    ft2, ft2
+mul.s      ft2, ft2, ft5
+jal        coss_s16
+ NOP
+mtc1       v0, ft3
+mtc1       a2, ft4
+li.s       AT, 1.0
+cvt.s.w    ft3, ft3
+swc1       ft4, 0x28(a3)
+sw         zero, 0x8(a3)
+sw         zero, 0xC(a3)
+sw         zero, 0x18(a3)
+sw         zero, 0x1C(a3)
+mul.s      ft3, ft3, ft5
+mtc1       t9, ft5
+sw         zero, 0x20(a3)
+sw         zero, 0x24(a3)
+sw         zero, 0x2C(a3)
+sw         zero, 0x30(a3)
+sw         zero, 0x34(a3)
+mul.s      ft3, ft3, ft4
+sw         zero, 0x38(a3)
+mul.s      ft2, ft2, ft4
+mtc1       AT, ft4
+swc1       ft3, 0x0(a3)
+mul.s      ft3, ft3, ft5
+swc1       ft4, 0x3C(a3)
+swc1       ft2, 0x4(a3)
+neg.s      ft2, ft2
+swc1       ft2, 0x10(a3)
+swc1       ft3, 0x14(a3)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+jr         ra
+ NOP
+END(mtxf_billboard)
+
+LEAF(vec3s_rotate_rpy)
+addiu      sp, sp, -0x8
+sd         ra, 0x0(sp)
+or         a2, a0, zero
+lh         t3, 0x0(a2)
+lh         t4, 0x2(a2)
+lh         t5, 0x4(a2)
+jal        sins_s16
+ lh        a0, 0x0(a2)
+or         t6, v0, zero
+jal        coss_s16
+ lh        a0, 0x0(a2)
+mult       t3, t6
+or         t7, v0, zero
+lh         a0, 0x2(a2)
+mflo       t0
+NOP
+NOP
+mult       t4, t6
+mflo       t1
+NOP
+NOP
+mult       t3, t7
+mflo       t3
+sub        t3, t3, t1
+sra        t3, t3, 16
+mult       t4, t7
+mflo       t4
+add        t4, t4, t0
+jal        sins_s16
+ sra       t4, t4, 16
+or         t6, v0, zero
+jal        coss_s16
+ lh        a0, 0x2(a2)
+mult       t4, t6
+or         t7, v0, zero
+lh         a0, 0x4(a2)
+mflo       t0
+NOP
+NOP
+mult       t5, t6
+mflo       t1
+NOP
+NOP
+mult       t4, t7
+mflo       t4
+sub        t4, t4, t1
+sra        t4, t4, 16
+mult       t5, t7
+mflo       t5
+add        t5, t5, t0
+jal        sins_s16
+ sra       t5, t5, 16
+or         t6, v0, zero
+jal        coss_s16
+ lh        a0, 0x4(a2)
+mult       t3, t6
+or         t7, v0, zero
+sh         t4, 0x2(a2)
+mflo       t0
+NOP
+NOP
+mult       t5, t6
+mflo       t1
+NOP
+NOP
+mult       t3, t7
+mflo       t3
+add        t3, t3, t1
+sra        t3, t3, 16
+mult       t5, t7
+sh         t3, 0x0(a2)
+mflo       t5
+sub        t5, t5, t0
+sra        t5, t5, 16
+sh         t5, 0x4(a2)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+jr         ra
+ NOP
+END(vec3s_rotate_rpy)
+
+/* Official Name: mathOneFloatRPY */
+LEAF(vec3f_rotate)
+addiu      sp, sp, -0x8
+sd         ra, 0x0(sp)
+or         a2, a0, zero
+lwc1       ft0, 0x0(a2)
+lwc1       ft1, 0x4(a2)
+lwc1       ft2, 0x8(a2)
+jal        sins_f
+ lh        a0, 0x4(a2)
+mul.s      ft3, ft0, fv0
+lh         a0, 0x4(a2)
+mul.s      fa0, ft1, fv0
+jal        coss_f
+ NOP
+mul.s      ft0, ft0, fv0
+lh         a0, 0x2(a2)
+mul.s      ft1, ft1, fv0
+sub.s      ft0, ft0, fa0
+jal        sins_f
+ add.s     ft1, ft1, ft3
+mul.s      ft3, ft1, fv0
+lh         a0, 0x2(a2)
+mul.s      fa0, ft2, fv0
+jal        coss_f
+ NOP
+mul.s      ft1, ft1, fv0
+lh         a0, 0x0(a2)
+mul.s      ft2, ft2, fv0
+sub.s      ft1, ft1, fa0
+jal        sins_f
+ add.s     ft2, ft2, ft3
+mul.s      ft3, ft0, fv0
+lh         a0, 0x0(a2)
+mul.s      fa0, ft2, fv0
+jal        coss_f
+ NOP
+mul.s      ft0, ft0, fv0
+swc1       ft1, 0x4(a2)
+mul.s      ft2, ft2, fv0
+add.s      ft0, ft0, fa0
+sub.s      ft2, ft2, ft3
+swc1       ft0, 0x0(a2)
+swc1       ft2, 0x8(a2)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+jr         ra
+ NOP
+END(vec3f_rotate)
+
+/* Official Name: mathOneFloatYPR */
+LEAF(vec3f_rotate_ypr)
+addiu      sp, sp, -0x8
+sd         ra, 0x0(sp)
+or         a2, a0, zero
+lwc1       ft0, 0x0(a2)
+lwc1       ft1, 0x4(a2)
+lwc1       ft2, 0x8(a2)
+jal        sins_f
+ lh        a0, 0x0(a2)
+mul.s      ft3, ft0, fv0
+lh         a0, 0x0(a2)
+mul.s      fa0, ft2, fv0
+jal        coss_f
+ NOP
+mul.s      ft0, ft0, fv0
+lh         a0, 0x2(a2)
+mul.s      ft2, ft2, fv0
+add.s      ft0, ft0, fa0
+jal        sins_f
+ sub.s     ft2, ft2, ft3
+mul.s      ft3, ft1, fv0
+lh         a0, 0x2(a2)
+mul.s      fa0, ft2, fv0
+jal        coss_f
+ NOP
+mul.s      ft1, ft1, fv0
+lh         a0, 0x4(a2)
+mul.s      ft2, ft2, fv0
+sub.s      ft1, ft1, fa0
+jal        sins_f
+ add.s     ft2, ft2, ft3
+mul.s      ft3, ft0, fv0
+lh         a0, 0x4(a2)
+mul.s      fa0, ft1, fv0
+jal        coss_f
+ NOP
+mul.s      ft0, ft0, fv0
+swc1       ft2, 0x8(a2)
+mul.s      ft1, ft1, fv0
+sub.s      ft0, ft0, fa0
+add.s      ft1, ft1, ft3
+swc1       ft0, 0x0(a2)
+swc1       ft1, 0x4(a2)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+jr         ra
+ NOP
+END(vec3f_rotate_ypr)
+
+/* Official Name: mathOneFloatPY */
+LEAF(vec3f_rotate_py)
+addiu      sp, sp, -0x8
+sd         ra, 0x0(sp)
+or         a2, a0, zero
+lwc1       ft2, 0x8(a2)
+jal        sins_f
+ lh        a0, 0x2(a2)
+mul.s      ft1, ft2, fv0
+jal        coss_f
+ lh        a0, 0x2(a2)
+mul.s      ft2, ft2, fv0
+neg.s      ft1, ft1
+jal        sins_f
+ lh        a0, 0x0(a2)
+mul.s      ft0, ft2, fv0
+jal        coss_f
+ lh        a0, 0x0(a2)
+mul.s      ft2, ft2, fv0
+swc1       ft0, 0x0(a2)
+swc1       ft1, 0x4(a2)
+swc1       ft2, 0x8(a2)
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+jr         ra
+ NOP
+END(vec3f_rotate_py)
+
+/* Official Name: mathXZInTri */
+LEAF(tri2d_xz_contains_point)
+lw         t6, 0x10(sp)
+lh         t0, 0x0(a2)
+lh         t1, 0x4(a2)
+lh         t3, 0x4(a3)
+lh         t4, 0x0(t6)
+lh         t5, 0x4(t6)
+sub        t6, a0, t0
+sub        t7, t3, t1
+multu      t6, t7
+lh         t2, 0x0(a3)
+sub        t9, a2, t1
+addiu      v0, zero, 0x0
+sub        t8, t2, t0
+ori        a3, zero, 0x1
+mflo       t6
+mflo       t6
+NOP
+NOP
+multu      t8, t9
+mflo       t7
+mflo       t8
+sub        t6, t6, t7
+bgezl      t6, .L80070558
+ sub       t6, a0, t2
+xor        a3, a3, a3
+sub        t6, a0, t2
+.L80070558:
+sub        t7, t5, t3
+multu      t6, t7
+sub        t8, t4, t2
+sub        t9, a2, t3
+ori        a2, zero, 0x1
+mflo       t6
+mflo       t6
+NOP
+NOP
+multu      t8, t9
+mflo       t7
+mflo       t8
+sub        t6, t6, t7
+bgez       t6, .L80070598
+ NOP
+xor        a2, a2, a2
+.L80070598:
+bne        a3, a2, .L800705F0
+ NOP
+sub        t6, a0, t4
+sub        t7, t1, t5
+multu      t6, t7
+sub        t8, t0, t4
+sub        t9, a2, t5
+ori        a2, zero, 0x1
+mflo       t6
+mflo       t6
+NOP
+NOP
+multu      t8, t9
+mflo       t7
+mflo       t8
+sub        t6, t6, t7
+bgez       t6, .L800705E4
+ NOP
+xor        a2, a2, a2
+.L800705E4:
+bne        a2, a2, .L800705F0
+ NOP
+ori        v0, zero, 0x1
+.L800705F0:
+jr         ra
+ NOP
+END(tri2d_xz_contains_point)
+
+/* Official Name: mathTranslateMtx */
+LEAF(mtxf_from_translation)
+or         t0, a0, zero
+addiu      t1, t0, 0x40
+.L80070600:
+addiu      t0, t0, 0x4
+bne        t1, t0, .L80070600
+ sw        zero, -0x4(t0)
+li.s       AT, 1.0
+mtc1       AT, ft5
+NOP
+swc1       ft5, 0x0(a0)
+swc1       ft5, 0x14(a0)
+swc1       ft5, 0x28(a0)
+swc1       ft5, 0x3C(a0)
+sw         a2, 0x30(a0)
+sw         a2, 0x34(a0)
+jr         ra
+ sw        a3, 0x38(a0)
+END(mtxf_from_translation)
+
+/* Official Name: mathScaleMtx */
+LEAF(mtxf_from_scale)
+or         t0, a0, zero
+addiu      t1, t0, 0x40
+.L80070640:
+addiu      t0, t0, 0x4
+bne        t1, t0, .L80070640
+ sw        zero, -0x4(t0)
+li.s       AT, 1.0
+mtc1       AT, ft5
+NOP
+swc1       ft5, 0x3C(a0)
+sw         a2, 0x0(a0)
+sw         a2, 0x14(a0)
+jr         ra
+ sw        a3, 0x28(a0)
+END(mtxf_from_scale)
+
+LEAF(atan2s)
+or         t0, a0, a2
+bne        zero, t0, .L80070680
+ NOP
+jr         ra
+ addiu     v0, zero, 0x0
+.L80070680:
+bltz       a0, .L80070698
+ NOP
+bltzl      a2, .L800706B8
+ negu      a2, a2
+j          .L800706C8
+ addiu     v0, zero, 0x0
+.L80070698:
+bltz       a2, .L800706A8
+ negu      a0, a0
+j          .L800706BC
+ ori       v0, zero, 0xC000
+.L800706A8:
+negu       a2, a2
+j          .L800706C8
+ ori       v0, zero, 0x8000
+negu       a2, a2
+.L800706B8:
+addiu      v0, zero, 0x4000
+.L800706BC:
+xor        a0, a0, a2
+xor        a2, a0, a2
+xor        a0, a0, a2
+.L800706C8:
+subu       t0, a0, a2
+bltzl      t0, .L80070718
+ dsll      t0, a0, 11
+dsll       t0, a2, 11
+ddivu      zero, t0, a0
+lui        t1, %hi(gArcTanTable)
+addiu      t1, t1, %lo(gArcTanTable)
+addiu      v0, v0, 0x4000
+bnez       a0, .L800706F4
+ NOP
+break      7
+.L800706F4:
+mflo       t0
+mflo       t0
+andi       t0, t0, 0xFFE
+addu       t1, t1, t0
+lh         t0, 0x0(t1)
+subu       v0, v0, t0
+jr         ra
+ andi      v0, v0, 0xFFFF
+dsll       t0, a0, 11
+.L80070718:
+ddivu      zero, t0, a2
+lui        t1, %hi(gArcTanTable)
+addiu      t1, t1, %lo(gArcTanTable)
+bnez       a2, .L80070730
+ NOP
+break      7
+.L80070730:
+mflo       t0
+mflo       t0
+andi       t0, t0, 0xFFE
+addu       t1, t1, t0
+lh         t0, 0x0(t1)
+addu       v0, v0, t0
+jr         ra
+ andi      v0, v0, 0xFFFF
+END(atan2s)
+
+LEAF(arctan2_f)
+li.s       AT, 255.0
+mtc1       AT, fv0
+NOP
+mul.s      fa0, fa0, fv0
+NOP
+mul.s      fa1, fa1, fv0
+cvt.w.s    fa0, fa0
+cvt.w.s    fa1, fa1
+mfc1       a0, fa0
+mfc1       a2, fa1
+j          atan2s
+ NOP
+END(arctan2_f)
+
+LEAF(fix32_sqrt)
+mtc1       a0, fv0
+li.s       AT, 65536.0
+mtc1       AT, fv1
+cvt.s.w    fv0, fv0
+div.s      fv0, fv0, fv1
+sqrt.s     fv0, fv0
+mul.s      fv0, fv0, fv1
+cvt.w.s    fv0, fv0
+mfc1       v0, fv0
+jr         ra
+ NOP
+END(fix32_sqrt)
+
+LEAF(bad_int_sqrt)
+mtc1       a0, fv0
+NOP
+sqrt.s     fv0, fv0
+mfc1       v0, fv0
+jr         ra
+ NOP
+END(bad_int_sqrt)
+
+LEAF(sins_f)
+addiu      sp, sp, -0x8
+sd         ra, 0x0(sp)
+jal        sins_s16
+ NOP
+mtc1       v0, fv0
+li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
+mtc1       AT, fv1
+cvt.s.w    fv0, fv0
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+mul.s      fv0, fv0, fv1
+jr         ra
+ NOP
+END(sins_f)
+
+LEAF(coss_f)
+addiu      sp, sp, -0x8
+sd         ra, 0x0(sp)
+jal        coss_s16
+ NOP
+mtc1       v0, fv0
+li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
+mtc1       AT, fv1
+cvt.s.w    fv0, fv0
+ld         ra, 0x0(sp)
+addiu      sp, sp, 0x8
+mul.s      fv0, fv0, fv1
+jr         ra
+ NOP
+END(coss_f)
+
+/* Official Name: mathCosInterp */
+LEAF(coss_s16)
+addiu      a0, a0, 0x4000
+/* Fall through */
+
+/* Official Name: mathSinInterp */
+XLEAF(sins_s16)
+sll        v0, a0, 17
+bgezl      v0, .L80070844
+srl        t2, a0, 3
+xori       a0, a0, 0x7FFF
+srl        t2, a0, 3
+.L80070844:
+lui        v0, %hi(gSineTable)
+andi       t2, t2, 0x7FE
+addiu      v0, v0, %lo(gSineTable)
+addu       v0, v0, t2
+lhu        t2, 0x2(v0)
+lhu        v0, 0x0(v0)
+andi       t1, a0, 0xF
+sll        a0, a0, 16
+subu       t2, t2, v0
+multu      t2, t1
+sll        v0, v0, 1
+mflo       t2
+srl        t2, t2, 3
+bgez       a0, .L80070884
+ addu      v0, v0, t2
+negu       v0, v0
+.L80070884:
+jr         ra
+NOP
+END(coss_s16)
+#ifdef MODERN_CC
+.size sins_s16, . - sins_s16
+#endif
+
+/* Official Name: mathCos */
+LEAF(coss_2)
+addiu      a0, a0, 0x4000
+/* Fall through */
+
+/* Official Name: mathSin */
+XLEAF(sins_2)
+sll        v0, a0, 17
+bgezl      v0, .L800708A4
+srl        t2, a0, 3
+xori       a0, a0, 0x7FFF
+srl        t2, a0, 3
+.L800708A4:
+lui        v0, %hi(gSineTable)
+andi       t2, t2, 0x7FE
+addiu      v0, v0, %lo(gSineTable)
+addu       v0, v0, t2
+lhu        v0, 0x0(v0)
+sll        a0, a0, 16
+bgez       a0, .L800708C8
+sll       v0, v0, 1
+negu       v0, v0
+.L800708C8:
+jr         ra
+NOP
+END(coss_2)
+#ifdef MODERN_CC
+.size sins_2, . - sins_2
+#endif
+
+LEAF(calc_dyn_lighting_for_level_segment)
+lw         t1, 0x0(a2)
+lw         t2, 0x4(a2)
+lw         t3, 0x8(a2)
+lhu        t0, 0x20(a0)
+lw         a2, 0xC(a0)
+lw         a2, 0x2C(a0)
+lw         a0, 0x0(a0)
+xor        v0, v0, v0
+.L800708F0:
+lbu        t4, 0x6(a2)
+addiu      t4, t4, -0xFF
+beql       t4, zero, .L80070A08
+ lhu       t4, 0x2(a2)
+beql       v0, zero, .L80070934
+ NOP
+ori        t4, zero, 0xA
+multu      v0, t4
+ori        t5, zero, 0xA
+mflo       t4
+addu       a0, a0, t4
+NOP
+multu      v0, t5
+xor        v0, v0, v0
+mflo       t5
+addu       a2, a2, t5
+NOP
+.L80070934:
+lhu        t5, 0x2(a2)
+lhu        t4, 0xE(a2)
+addiu      a2, a2, 0xC
+subu       t4, t4, t5
+.L80070944:
+lh         t5, 0x0(a2)
+lh         t6, 0x2(a2)
+lh         t7, 0x4(a2)
+mult       t5, t1
+lbu        t8, 0x7(a2)
+lbu        a3, 0x6(a2)
+lbu        t9, 0x8(a2)
+sll        t8, t8, 16
+lbu        v1, 0x9(a2)
+or         t8, a3, t8
+mflo       t5
+NOP
+NOP
+mult       t6, t2
+mflo       t6
+add        t5, t5, t6
+NOP
+mult       t7, t3
+mflo       t7
+add        t5, t5, t7
+blez       t5, .L800709B4
+ NOP
+srl        t5, t5, 22
+addu       v1, v1, t5
+sltiu      t5, v1, 0x81
+bnez       t5, .L800709B4
+ NOP
+ori        v1, zero, 0x80
+.L800709B4:
+multu      v1, t8
+addiu      a2, a2, 0xA
+addiu      t4, t4, -0x1
+addiu      a0, a0, 0xA
+mflo       t8
+srl        t8, t8, 7
+sb         t8, -0x4(a0)
+multu      v1, t9
+srl        t8, t8, 16
+sb         t8, -0x3(a0)
+mflo       t9
+srl        t9, t9, 7
+sb         t9, -0x2(a0)
+bnel       t4, zero, .L80070944
+ NOP
+addiu      t0, t0, -0x1
+bnel       t0, zero, .L800708F0
+ NOP
+jr         ra
+ NOP
+END(calc_dyn_lighting_for_level_segment)
+
+LEAF(func_80070A04)
+lhu        t4, 0x2(a2)
+.L80070A08:
+lhu        t5, 0xE(a2)
+addiu      a2, a2, 0xC
+addiu      t0, t0, -0x1
+subu       t4, t5, t4
+addu       v0, v0, t4
+bnel       t0, zero, .L800708F0
+ NOP
+jr         ra
+ NOP
+END(func_80070A04)
+
+LEAF(area_triangle_2d)
+mtc1       a2, ft0
+mov.s      fv0, fa0
+mtc1       a3, ft1
+sub.s      fa0, ft0, fv0
+mov.s      fv1, fa1
+lwc1       ft2, 0x10(sp)
+sub.s      fa1, ft1, fv1
+mul.s      fa0, fa0, fa0
+lwc1       ft3, 0x14(sp)
+sub.s      ft4, ft2, ft0
+mul.s      fa1, fa1, fa1
+li.s       AT, 0.5
+sub.s      ft5, ft3, ft1
+mul.s      ft4, ft4, ft4
+sub.s      fv0, fv0, ft2
+mul.s      ft5, ft5, ft5
+sub.s      fv1, fv1, ft3
+mul.s      fv0, fv0, fv0
+mtc1       AT, ft3
+add.s      fa0, fa0, fa1
+mul.s      fv1, fv1, fv1
+add.s      ft4, ft4, ft5
+sqrt.s     fa0, fa0
+sqrt.s     ft4, ft4
+add.s      fv0, fv0, fv1
+mtc1       zero, fv1
+add.s      ft5, fa0, ft4
+sqrt.s     fv0, fv0
+add.s      ft5, ft5, fv0
+mul.s      ft5, ft3, ft5
+sub.s      ft0, ft5, fa0
+sub.s      ft2, ft5, fv0
+mul.s      fv0, ft0, ft5
+sub.s      ft1, ft5, ft4
+mul.s      ft1, ft1, ft2
+NOP
+mul.s      fv0, fv0, ft1
+c.lt.s     fv0, fv1
+bc1fl      .L80070AD0
+ NOP
+mov.s      fv0, fv1
+.L80070AD0:
+jr         ra
+ sqrt.s    fv0, fv0
+END(area_triangle_2d)
+
+LEAF(set_breakpoint)
+ori        a0, a0, 0x1
+MTC0(      a0, C0_WATCHLO)
+addiu      t0, zero, 0xF
+MTC0(      t0, C0_WATCHHI)
+NOP
+NOP
+NOP
+NOP
+NOP
+jr         ra
+ NOP
+END(set_breakpoint)
+
+LEAF(dmacopy_doubleword)
+ld         t0, 0x0(a0)
+ld         t1, 0x8(a0)
+addi       a2, a2, 0x10
+addi       a0, a0, 0x10
+sd         t0, -0x10(a2)
+bne        a2, a2, dmacopy_doubleword
+ sd        t1, -0x8(a2)
+jr         ra
+ NOP
+END(dmacopy_doubleword)
diff --git a/ver/splat/dkr.us.v77.yaml b/ver/splat/dkr.us.v77.yaml
index 161a5743b..06add44c6 100644
--- a/ver/splat/dkr.us.v77.yaml
+++ b/ver/splat/dkr.us.v77.yaml
@@ -80,7 +80,7 @@ segments:
       - [0x6AD00, c, joypad]
       - [0x6B2B0, c, game]
       - [0x6CF30, c, thread3_main]
-      - [0x70110, hasm, hasm/math_util]
+      - [0x70110, hasm, hasm/ido/math_util]
       - [0x71730, c, memory]
       - [0x72930, c, ../libultra/src/io/motor]
       - [0x72E50, c, save_data]
@@ -290,7 +290,7 @@ segments:
       - [0xDDF00, .data, joypad]
       - [0xDDF10, .data, game]
       - [0xDDF40, .data, thread3_main]
-      - [0xDE030, .data, hasm/math_util]
+      - [0xDE030, .data, hasm/ido/math_util]
       - [0xDF040, .data, save_data]
       - [0xDF090, .data, rcp_dkr]
       - [0xDF330, .data, ../libultra/src/sc/sched]

From fa709959df5bf618a836904d0935556e186ff4f3 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 4 Dec 2025 13:13:13 -0500
Subject: [PATCH 02/36] makefile up to date

---
 Makefile | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/Makefile b/Makefile
index 6ec96197e..2a6b3a4cd 100755
--- a/Makefile
+++ b/Makefile
@@ -275,8 +275,8 @@ $(BUILD_DIR)/$(LIBULTRA_DIR)/%.s.o: MIPSISET := -mips2
 $(BUILD_DIR)/$(LIBULTRA_DIR)/src/libc/%.s.o: OPT_FLAGS := -O2
 $(BUILD_DIR)/$(LIBULTRA_DIR)/src/os/exceptasm.s.o: MIPSISET := -mips3 -32
 
-# $(BUILD_DIR)/$(SRC_DIR)/hasm/ido/math_util.s.o: OPT_FLAGS := -O2
-# $(BUILD_DIR)/$(SRC_DIR)/hasm/ido/math_util.s.o: MIPSISET := -mips3 -32
+$(BUILD_DIR)/$(SRC_DIR)/hasm/ido/math_util.s.o: OPT_FLAGS := -O2
+$(BUILD_DIR)/$(SRC_DIR)/hasm/ido/math_util.s.o: MIPSISET := -mips3 -32
 
 # Allow dollar sign to be used in var names for this file alone
 # It allows us to return the current stack pointer
@@ -467,13 +467,13 @@ $(BUILD_DIR)/$(LIBULTRA_DIR)/%.s.o: $(LIBULTRA_DIR)/%.s | build_assets
 	@if [ "$(MIPSISET)" = "-mips3 -32" ]; then \
 		$(PYTHON) $(TOOLS_DIR)/python/patchmips3.py $@ || rm $@; \
 	fi
-# $(BUILD_DIR)/$(SRC_DIR)/hasm/ido/%.s.o: $(SRC_DIR)/hasm/ido/%.s | build_assets
-# 	$(call print,Assembling IDO:,$<,$@)
-# 	$(V)$(CC) -c $(CFLAGS) $(CC_WARNINGS) $(OPT_FLAGS) $(MIPSISET) -o $@ $<
-# 	$(V)$(STRIP) --strip-unneeded $@
-# 	@if [ "$(MIPSISET)" = "-mips3 -32" ]; then \
-# 		$(PYTHON) $(TOOLS_DIR)/python/patchmips3.py $@ || rm $@; \
-# 	fi
+$(BUILD_DIR)/$(SRC_DIR)/hasm/ido/%.s.o: $(SRC_DIR)/hasm/ido/%.s | build_assets
+	$(call print,Assembling IDO:,$<,$@)
+	$(V)$(CC) -c $(CFLAGS) $(CC_WARNINGS) $(OPT_FLAGS) $(MIPSISET) -o $@ $<
+	$(V)$(STRIP) --strip-unneeded $@
+	@if [ "$(MIPSISET)" = "-mips3 -32" ]; then \
+		$(PYTHON) $(TOOLS_DIR)/python/patchmips3.py $@ || rm $@; \
+	fi
 else
 # libultra asm files - Compile with the gcc c compiler
 $(BUILD_DIR)/$(LIBULTRA_DIR)/%.s.o: $(LIBULTRA_DIR)/%.s | build_assets

From b0eafd81236c61b4833331379a0f13c96a51ce4c Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 4 Dec 2025 15:31:40 -0500
Subject: [PATCH 03/36] Get the first match for math_util!

---
 src/hasm/ido/math_util.s | 2608 ++++++++++++++++++--------------------
 1 file changed, 1240 insertions(+), 1368 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index bf9aa2615..f2b2f3088 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -207,1090 +207,986 @@ LEAF(get_gIntDisFlag)
 END(get_gIntDisFlag)
 
 LEAF(mtx_to_mtxs)
-ori        t0, zero, 0x4
-lui        t7, 0xFFFF
-.L8006F584:
-lw         t1, 0x0(a0)
-lw         t2, 0x20(a0)
-lw         t3, 0x4(a0)
-lw         t4, 0x24(a0)
-sh         t1, 0x4(a2)
-sh         t2, 0x6(a2)
-sh         t3, 0xC(a2)
-sh         t4, 0xE(a2)
-srl        t1, t1, 16
-srl        t2, t2, 16
-srl        t3, t3, 16
-srl        t4, t4, 16
-addiu      a0, a0, 0x8
-sh         t1, 0x0(a2)
-sh         t2, 0x2(a2)
-sh         t3, 0x8(a2)
-sh         t4, 0xA(a2)
-addi       a2, a2, 0x10
-addiu      t0, t0, -0x1
-bnel       t0, zero, .L8006F584
- NOP
-jr         ra
- NOP
+    ori        t0, zero, 4
+    lui        t7, 0xFFFF
+    .L8006F584:
+    lw         t1, 0x0(a0)
+    lw         t2, 0x20(a0)
+    lw         t3, 0x4(a0)
+    lw         t4, 0x24(a0)
+    sh         t1, 0x4(a1)
+    sh         t2, 0x6(a1)
+    sh         t3, 0xC(a1)
+    sh         t4, 0xE(a1)
+    addiu      a0, a0, 0x8
+    srl        t1, t1, 16
+    srl        t2, t2, 16
+    srl        t3, t3, 16
+    srl        t4, t4, 16
+    sh         t1, 0x0(a1)
+    sh         t2, 0x2(a1)
+    sh         t3, 0x8(a1)
+    sh         t4, 0xA(a1)
+    addi       a1, a1, 0x10
+    addiu      t0, -1
+    bnezl      t0, .L8006F584
+    jr         ra
 END(mtx_to_mtxs)
 
 LEAF(mtxf_to_mtxs)
-li.s       AT, 65536.0
-mtc1       AT, fa0
-ori        t0, zero, 0x4
-.L8006F5EC:
-lwc1       ft0, 0x0(a0)
-lwc1       ft1, 0x4(a0)
-lwc1       ft2, 0x8(a0)
-mul.s      ft0, ft0, fa0
-lwc1       ft3, 0xC(a0)
-addiu      a0, a0, 0x10
-mul.s      ft1, ft1, fa0
-addiu      t0, t0, -0x1
-addiu      a2, a2, 0x10
-mul.s      ft2, ft2, fa0
-NOP
-mul.s      ft3, ft3, fa0
-trunc.w.s  ft0, ft0
-trunc.w.s  ft1, ft1
-swc1       ft0, -0x10(a2)
-trunc.w.s  ft2, ft2
-swc1       ft1, -0xC(a2)
-trunc.w.s  ft3, ft3
-swc1       ft2, -0x8(a2)
-swc1       ft3, -0x4(a2)
-bnel       t0, zero, .L8006F5EC
- NOP
-jr         ra
- NOP
+    li.s       fa0, 65536.0
+    ori        t0, zero, 4
+    .L8006F5EC:
+    lwc1       ft0, 0x0(a0)
+    lwc1       ft1, 0x4(a0)
+    lwc1       ft2, 0x8(a0)
+    mul.s      ft0, ft0, fa0
+    lwc1       ft3, 0xC(a0)
+    addiu      a0, a0, 0x10
+    mul.s      ft1, ft1, fa0
+    addiu      t0, t0, -0x1
+    addiu      a1, a1, 0x10
+    mul.s      ft2, ft2, fa0
+    mul.s      ft3, ft3, fa0
+    trunc.w.s  ft0, ft0
+    trunc.w.s  ft1, ft1
+    swc1       ft0, -0x10(a1)
+    trunc.w.s  ft2, ft2
+    swc1       ft1, -0xC(a1)
+    trunc.w.s  ft3, ft3
+    swc1       ft2, -0x8(a1)
+    swc1       ft3, -0x4(a1)
+    bnezl      t0, .L8006F5EC
+    jr         ra
 END(mtxf_to_mtxs)
 
 /* Official Name: mathMtxXFMF */
 LEAF(mtxf_transform_point)
-mtc1       a2, fa0
-lwc1       ft0, 0x0(a0)
-mtc1       a2, fa1
-lwc1       ft2, 0x10(a0)
-mul.s      ft1, ft0, fa0
-mtc1       a3, ft4
-lwc1       ft0, 0x20(a0)
-mul.s      ft3, ft2, fa1
-lw         t6, 0x10(sp)
-mul.s      ft2, ft0, ft4
-add.s      ft5, ft1, ft3
-lwc1       ft3, 0x30(a0)
-add.s      ft1, ft5, ft2
-add.s      ft0, ft3, ft1
-swc1       ft0, 0x0(t6)
-lwc1       ft5, 0x4(a0)
-lwc1       ft3, 0x14(a0)
-lw         t7, 0x14(sp)
-mul.s      ft2, ft5, fa0
-lwc1       ft5, 0x24(a0)
-mul.s      ft1, ft3, fa1
-add.s      ft0, ft2, ft1
-mul.s      ft3, ft5, ft4
-lwc1       ft1, 0x34(a0)
-add.s      ft2, ft0, ft3
-add.s      ft5, ft1, ft2
-swc1       ft5, 0x0(t7)
-lwc1       ft0, 0x8(a0)
-lwc1       ft1, 0x18(a0)
-lw         t8, 0x18(sp)
-mul.s      ft3, ft0, fa0
-lwc1       ft0, 0x28(a0)
-mul.s      ft2, ft1, fa1
-add.s      ft5, ft3, ft2
-mul.s      ft1, ft0, ft4
-lwc1       ft2, 0x38(a0)
-add.s      ft3, ft5, ft1
-add.s      ft0, ft2, ft3
-jr         ra
- swc1      ft0, 0x0(t8)
+    mtc1       a1, fa0
+    mtc1       a2, fa1
+    mtc1       a3, ft4
+    lwc1       ft0, 0x0(a0)
+    lwc1       ft2, 0x10(a0)
+    mul.s      ft1, ft0, fa0
+    lwc1       ft0, 0x20(a0)
+    mul.s      ft3, ft2, fa1
+    mul.s      ft2, ft0, ft4
+    add.s      ft5, ft1, ft3
+    lwc1       ft3, 0x30(a0)
+    add.s      ft1, ft5, ft2
+    add.s      ft0, ft3, ft1
+    lw         t6,  0x10($sp)
+    swc1       ft0, 0x0(t6)
+    lwc1       ft5, 0x4(a0)
+    lwc1       ft3, 0x14(a0)
+    mul.s      ft2, ft5, fa0
+    lwc1       ft5, 0x24(a0)
+    mul.s      ft1, ft3, fa1
+    add.s      ft0, ft2, ft1
+    mul.s      ft3, ft5, ft4
+    lwc1       ft1, 0x34(a0)
+    add.s      ft2, ft0, ft3
+    add.s      ft5, ft1, ft2
+    lw         t7,  0x14($sp)
+    swc1       ft5, 0x0(t7)
+    lwc1       ft0, 0x8(a0)
+    lwc1       ft1, 0x18(a0)
+    mul.s      ft3, ft0, fa0
+    lwc1       ft0, 0x28(a0)
+    mul.s      ft2, ft1, fa1
+    add.s      ft5, ft3, ft2
+    mul.s      ft1, ft0, ft4
+    lwc1       ft2, 0x38(a0)
+    add.s      ft3, ft5, ft1
+    add.s      ft0, ft2, ft3
+    lw         t8,  0x18($sp)
+    swc1       ft0, 0x0(t8)
+    jr         ra
 END(mtxf_transform_point)
 
 /* Official Name: mathMtxFastXFMF */
 LEAF(mtxf_transform_dir)
-lwc1       ft0, 0x0(a2)
-lwc1       ft3, 0x0(a0)
-lwc1       ft1, 0x4(a2)
-lwc1       fa0, 0x10(a0)
-mul.s      ft3, ft0, ft3
-lwc1       ft2, 0x8(a2)
-lwc1       fa1, 0x20(a0)
-mul.s      fa0, ft1, fa0
-add.s      fa0, ft3, fa0
-mul.s      fa1, ft2, fa1
-lwc1       ft3, 0x4(a0)
-mul.s      ft3, ft0, ft3
-add.s      ft4, fa0, fa1
-lwc1       fa0, 0x14(a0)
-lwc1       fa1, 0x24(a0)
-mul.s      fa0, ft1, fa0
-swc1       ft4, 0x0(a2)
-mul.s      fa1, ft2, fa1
-add.s      fa0, ft3, fa0
-lwc1       ft3, 0x8(a0)
-add.s      ft4, fa0, fa1
-mul.s      ft3, ft0, ft3
-lwc1       fa0, 0x18(a0)
-lwc1       fa1, 0x28(a0)
-swc1       ft4, 0x4(a2)
-mul.s      fa0, ft1, fa0
-add.s      fa0, ft3, fa0
-mul.s      fa1, ft2, fa1
-add.s      fa1, fa0, fa1
-jr         ra
- swc1      fa1, 0x8(a2)
+    lwc1       ft0, 0x0(a1)
+    lwc1       ft1, 0x4(a1)
+    lwc1       ft3, 0x0(a0)
+    lwc1       fa0, 0x10(a0)
+    mul.s      ft3, ft0, ft3
+    lwc1       ft2, 0x8(a1)
+    lwc1       fa1, 0x20(a0)
+    mul.s      fa0, ft1, fa0
+    add.s      fa0, ft3, fa0
+    mul.s      fa1, ft2, fa1
+    lwc1       ft3, 0x4(a0)
+    mul.s      ft3, ft0, ft3
+    add.s      ft4, fa0, fa1
+    lwc1       fa0, 0x14(a0)
+    lwc1       fa1, 0x24(a0)
+    mul.s      fa0, ft1, fa0
+    swc1       ft4, 0x0(a2)
+    mul.s      fa1, ft2, fa1
+    add.s      fa0, ft3, fa0
+    lwc1       ft3, 0x8(a0)
+    add.s      ft4, fa0, fa1
+    mul.s      ft3, ft0, ft3
+    lwc1       fa0, 0x18(a0)
+    lwc1       fa1, 0x28(a0)
+    swc1       ft4, 0x4(a2)
+    mul.s      fa0, ft1, fa0
+    add.s      fa0, ft3, fa0
+    mul.s      fa1, ft2, fa1
+    add.s      fa1, fa0, fa1
+    swc1       fa1, 0x8(a2)
+    jr         ra
 END(mtxf_transform_dir)
 
 /* Official Name: mathMtxCatF */
 LEAF(mtxf_mul)
-addiu      sp, sp, -0x8
-sdc1       fv1, 0x0(sp)
-ori        t0, zero, 0x4
-.L8006F774:
-lwc1       fv1, 0x0(a0)
-lwc1       ft3, 0x0(a2)
-lwc1       ft0, 0x4(a0)
-lwc1       fa0, 0x10(a2)
-mul.s      ft3, fv1, ft3
-lwc1       ft1, 0x8(a0)
-lwc1       fa1, 0x20(a2)
-mul.s      fa0, ft0, fa0
-lwc1       ft2, 0xC(a0)
-lwc1       ft4, 0x30(a2)
-mul.s      fa1, ft1, fa1
-addiu      a0, a0, 0x10
-addiu      a2, a2, 0x10
-mul.s      ft4, ft2, ft4
-addiu      t0, t0, -0x1
-add.s      fa1, fa0, fa1
-lwc1       fa0, 0x14(a2)
-add.s      ft4, ft3, ft4
-lwc1       ft3, 0x4(a2)
-mul.s      ft3, fv1, ft3
-add.s      ft5, fa1, ft4
-lwc1       fa1, 0x24(a2)
-mul.s      fa0, ft0, fa0
-lwc1       ft4, 0x34(a2)
-swc1       ft5, -0x10(a2)
-mul.s      fa1, ft1, fa1
-NOP
-mul.s      ft4, ft2, ft4
-add.s      fa1, fa0, fa1
-lwc1       fa0, 0x18(a2)
-add.s      ft4, ft3, ft4
-lwc1       ft3, 0x8(a2)
-mul.s      ft3, fv1, ft3
-add.s      ft5, fa1, ft4
-lwc1       fa1, 0x28(a2)
-mul.s      fa0, ft0, fa0
-lwc1       ft4, 0x38(a2)
-swc1       ft5, -0xC(a2)
-mul.s      fa1, ft1, fa1
-NOP
-mul.s      ft4, ft2, ft4
-add.s      fa1, fa0, fa1
-lwc1       fa0, 0x1C(a2)
-add.s      ft4, ft3, ft4
-lwc1       ft3, 0xC(a2)
-mul.s      ft3, fv1, ft3
-add.s      ft5, fa1, ft4
-lwc1       fa1, 0x2C(a2)
-mul.s      fa0, ft0, fa0
-lwc1       ft4, 0x3C(a2)
-swc1       ft5, -0x8(a2)
-mul.s      fa1, ft1, fa1
-NOP
-mul.s      ft4, ft2, ft4
-add.s      fa1, fa0, fa1
-add.s      ft4, ft3, ft4
-add.s      ft5, fa1, ft4
-swc1       ft5, -0x4(a2)
-bnel       t0, zero, .L8006F774
- NOP
-ldc1       fv1, 0x0(sp)
-jr         ra
- addiu     sp, sp, 0x8
+    addiu      sp, sp, -8
+    sdc1       fv1, 0(sp)
+    ori        t0, zero, 4
+    .L80048F88:
+    lwc1       fv1, 0x0(a0)
+    lwc1       ft0, 0x4(a0)
+    lwc1       ft1, 0x8(a0)
+    lwc1       ft2, 0xC(a0)
+    lwc1       ft3, 0x0(a1)
+    lwc1       fa0, 0x10(a1)
+    lwc1       fa1, 0x20(a1)
+    lwc1       ft4, 0x30(a1)
+    mul.s      ft3, fv1, ft3
+    mul.s      fa0, ft0, fa0
+    mul.s      fa1, ft1, fa1
+    mul.s      ft4, ft2, ft4
+    add.s      fa1, fa0, fa1
+    add.s      ft4, ft3, ft4
+    lwc1       ft3, 0x4(a1)
+    mul.s      ft3, fv1, ft3
+    add.s      ft5, fa1, ft4
+    lwc1       fa0, 0x14(a1)
+    mul.s      fa0, ft0, fa0
+    lwc1       fa1, 0x24(a1)
+    mul.s      fa1, ft1, fa1
+    add.s      fa1, fa0, fa1
+    lwc1       ft4, 0x34(a1)
+    swc1       ft5, 0x0(a2)
+    lwc1       fa0, 0x18(a1)
+    mul.s      ft4, ft2, ft4
+    add.s      ft4, ft3, ft4
+    lwc1       ft3, 0x08(a1)
+    mul.s      ft3, fv1, ft3
+    add.s      ft5, fa1, ft4
+    mul.s      fa0, ft0, fa0
+    lwc1       fa1, 0x28(a1)
+    lwc1       ft4, 0x38(a1)
+    swc1       ft5, 0x4(a2)
+    mul.s      fa1, ft1, fa1
+    mul.s      ft4, ft2, ft4
+    add.s      fa1, fa0, fa1
+    add.s      ft4, ft3, ft4
+    lwc1       ft3, 0xC(a1)
+    lwc1       fa0, 0x1C(a1)
+    mul.s      ft3, fv1, ft3
+    add.s      ft5, fa1, ft4
+    mul.s      fa0, ft0, fa0
+    lwc1       fa1, 0x2C(a1)
+    lwc1       ft4, 0x3C(a1)
+    swc1       ft5, 0x8(a2)
+    mul.s      fa1, ft1, fa1
+    mul.s      ft4, ft2, ft4
+    add.s      fa1, fa0, fa1
+    add.s      ft4, ft3, ft4
+    add.s      ft5, fa1, ft4
+    swc1       ft5, 0xC(a2)
+    addiu      a0, 0x10
+    addiu      a2, 0x10
+    addiu      t0, -1
+    bnezl      t0, .L80048F88
+    ldc1       fv1, 0(sp)
+    addiu      sp, sp, 8
+    jr         ra
 END(mtxf_mul)
 
 /* Official Name: mathMtxF2L */
 LEAF(mtxf_to_mtx)
-li.s       AT, 65536.0
-mtc1       AT, fa0
-ori        t0, zero, 0x4
-.L8006F87C:
-lwc1       ft0, 0x0(a0)
-lwc1       ft1, 0x4(a0)
-lwc1       ft2, 0x8(a0)
-mul.s      ft0, ft0, fa0
-lwc1       ft3, 0xC(a0)
-addiu      a0, a0, 0x10
-mul.s      ft1, ft1, fa0
-addiu      a2, a2, 0x8
-addiu      t0, t0, -0x1
-mul.s      ft2, ft2, fa0
-NOP
-mul.s      ft3, ft3, fa0
-cvt.w.s    ft0, ft0
-cvt.w.s    ft1, ft1
-mfc1       t1, ft0
-cvt.w.s    ft2, ft2
-mfc1       t2, ft1
-sh         t1, 0x18(a2)
-cvt.w.s    ft3, ft3
-mfc1       t3, ft2
-sh         t2, 0x1A(a2)
-srl        t1, t1, 16
-mfc1       t4, ft3
-sh         t3, 0x1C(a2)
-srl        t2, t2, 16
-sh         t4, 0x1E(a2)
-srl        t3, t3, 16
-srl        t4, t4, 16
-sh         t1, -0x8(a2)
-sh         t2, -0x6(a2)
-sh         t3, -0x4(a2)
-sh         t4, -0x2(a2)
-bnel       t0, zero, .L8006F87C
- NOP
-jr         ra
- NOP
+    li.s       fa0, 65536.0
+    ori        t0, zero, 4 /* Loop counter */
+    .L80049090:
+    lwc1       ft0, 0x0(a0)
+    lwc1       ft1, 0x4(a0)
+    lwc1       ft2, 0x8(a0)
+    lwc1       ft3, 0xC(a0)
+    mul.s      ft0, ft0, fa0
+    mul.s      ft1, ft1, fa0
+    mul.s      ft2, ft2, fa0
+    mul.s      ft3, ft3, fa0
+    cvt.w.s    ft0, ft0
+    cvt.w.s    ft1, ft1
+    cvt.w.s    ft2, ft2
+    cvt.w.s    ft3, ft3
+    mfc1       t1, ft0
+    mfc1       t2, ft1
+    mfc1       t3, ft2
+    mfc1       t4, ft3
+    sh         t1, 0x20(a1)
+    sh         t2, 0x22(a1)
+    sh         t3, 0x24(a1)
+    sh         t4, 0x26(a1)
+    srl        t1, t1, 16
+    srl        t2, t2, 16
+    srl        t3, t3, 16
+    srl        t4, t4, 16
+    sh         t1, 0(a1)
+    sh         t2, 0x2(a1)
+    sh         t3, 0x4(a1)
+    sh         t4, 0x6(a1)
+    addiu      a0, 0x10 /* Increment MtxF pointer by 16 bytes */
+    addiu      a1, 0x8  /* Increment Mtx pointer by 8 bytes */
+    addiu      t0, -1   /* Decrement loop counter */
+    bnezl      t0, .L80049090
+    jr         ra
 END(mtxf_to_mtx)
 
 /* Official Name: mathSeed */
 LEAF(set_rng_seed)
-lui        AT, %hi(gCurrentRNGSeed)
-jr         ra
- sw        a0, %lo(gCurrentRNGSeed)(AT)
+    sw         a0, gCurrentRNGSeed
+    jr         ra
 END(set_rng_seed)
 
 LEAF(save_rng_seed)
-lui        a0, %hi(gCurrentRNGSeed)
-lw         a0, %lo(gCurrentRNGSeed)(a0)
-lui        AT, %hi(gPrevRNGSeed)
-jr         ra
- sw        a0, %lo(gPrevRNGSeed)(AT)
+    lw         a0, gCurrentRNGSeed
+    sw         a0, gPrevRNGSeed
+    jr         ra
 END(save_rng_seed)
 
 LEAF(load_rng_seed)
-lui        a0, %hi(gPrevRNGSeed)
-lw         a0, %lo(gPrevRNGSeed)(a0)
-lui        AT, %hi(gCurrentRNGSeed)
-jr         ra
- sw        a0, %lo(gCurrentRNGSeed)(AT)
+    lw         a0, gPrevRNGSeed
+    sw         a0, gCurrentRNGSeed
+    jr         ra
 END(load_rng_seed)
 
 LEAF(get_rng_seed)
-lui        v0, %hi(gCurrentRNGSeed)
-jr         ra
- lw        v0, %lo(gCurrentRNGSeed)(v0)
+    lw        v0, gCurrentRNGSeed
+    jr         ra
 END(get_rng_seed)
 
 /* Official Name: mathRnd */
 LEAF(rand_range)
-lui        t0, %hi(gCurrentRNGSeed)
-lw         t0, %lo(gCurrentRNGSeed)(t0)
-lui        AT, %hi(gCurrentRNGSeed)
-sub        a2, a2, a0
-dsll32     t1, t0, 31
-dsll       t2, t0, 31
-dsrl       t1, t1, 31
-dsrl32     t2, t2, 0
-dsll32     t3, t0, 12
-or         t1, t1, t2
-dsrl32     t3, t3, 0
-xor        t1, t1, t3
-dsrl       t3, t1, 20
-andi       t3, t3, 0xFFF
-xor        t0, t3, t1
-sw         t0, %lo(gCurrentRNGSeed)(AT)
-addi       a2, a2, 0x1
-subu       t0, t0, a0
-divu       zero, t0, a2
-mflo       t0
-mfhi       v0
-add        v0, v0, a0
-bnez       a2, .L8006F9B0
- NOP
-break      7
-.L8006F9B0:
-jr         ra
- NOP
+    lw         t0, gCurrentRNGSeed
+    sub        a1, a0
+    dsll32     t1, t0, 31
+    dsll       t2, t0, 31
+    dsrl       t1, 31
+    dsrl32     t2, 0
+    dsll32     t3, t0, 12
+    or         t1, t2
+    dsrl32     t3, 0
+    xor        t1, t3
+    dsrl       t3, t1, 20
+    andi       t3, 0xFFF
+    xor        t0, t3, t1
+    sw         t0, gCurrentRNGSeed
+    addi       a1, 1
+    subu       t0, a0
+    divu       t0, a1
+    mfhi       v0
+    add        v0, a0
+    jr         ra
 END(rand_range)
 
 /* Official Name: fastShortReflection */
+/* Does t6 even do anything? */
 LEAF(vec3s_reflect)
-lh         t0, 0x0(a0)
-lh         t3, 0x0(a2)
-lh         t1, 0x2(a0)
-lh         t4, 0x2(a2)
-mult       t0, t3
-lh         t2, 0x4(a0)
-lh         t5, 0x4(a2)
-mflo       t6
-NOP
-NOP
-mult       t1, t4
-mflo       t7
-add        t6, t6, t7
-NOP
-mult       t2, t5
-mflo       t8
-add        t6, t6, t8
-sra        t6, t6, 12
-mult       t6, t3
-mflo       t3
-sra        t3, t3, 13
-sub        t3, t3, t0
-mult       t6, t4
-sh         t3, 0x6(a0)
-mflo       t4
-sra        t4, t4, 13
-sub        t4, t4, t1
-mult       t6, t5
-sh         t4, 0x8(a0)
-mflo       t5
-sra        t5, t5, 13
-sub        t5, t5, t0
-jr         ra
- sh        t5, 0xA(a0)
+    lh         t0, 0x0(a0)
+    lh         t1, 0x2(a0)
+    lh         t2, 0x4(a0)
+    lh         t3, 0x0(a1)
+    lh         t4, 0x2(a1)
+    lh         t5, 0x4(a1)
+    mult       t0, t3
+    mflo       t6
+    mult       t1, t4
+    mflo       t7
+    add        t6, t7
+    mult       t2, t5
+    mflo       t8
+    add        t6, t8
+    sra        t6, 12
+    mult       t6, t3
+    mflo       t3
+    sra        t3, 13
+    sub        t3, t0
+    sh         t3, 0x6(a0)
+    mult       t6, t4
+    mflo       t4
+    sra        t4, 13
+    sub        t4, t1
+    mult       t6, t5
+    sh         t4, 0x8(a0)
+    mflo       t5
+    sra        t5, 13
+    sub        t5, t0
+    sh         t5, 0xA(a0)
+    jr         ra
 END(vec3s_reflect)
 
 LEAF(mtx_to_mtxs_2)
-ori        t2, zero, 0x10
-xor        t3, t3, t3
-.L8006FA48:
-lh         t0, 0x0(a0)
-lhu        t1, 0x20(a0)
-addi       a0, a0, 0x2
-sll        t0, t0, 16
-or         t0, t0, t1
-sw         t0, 0x0(a2)
-addi       a2, a2, 0x4
-addiu      t3, t3, 0x1
-bnel       t3, t2, .L8006FA48
- NOP
-jr         ra
- NOP
+    ori        t2, zero, 0x10
+    xor        t3, t3
+    .L8006FA48:
+    lh         t0, 0x0(a0)
+    lhu        t1, 0x20(a0)
+    addi       a0, 0x2
+    sll        t0, 16
+    or         t0, t1
+    sw         t0, 0x0(a1)
+    addi       a1, 0x4
+    addiu      t3, 0x1
+    bnel       t3, t2, .L8006FA48
+    jr         ra
 END(mtx_to_mtxs_2)
 
 LEAF(mtxs_transform_point)
-lh         t0, 0x0(a2)
-lw         t3, 0x0(a0)
-lh         t1, 0x2(a2)
-lh         t2, 0x4(a2)
-mult       t0, t3
-lw         t3, 0x10(a0)
-mflo       t4
-NOP
-NOP
-mult       t1, t3
-lw         t3, 0x20(a0)
-mflo       t5
-add        t4, t4, t5
-NOP
-mult       t2, t3
-lw         t3, 0x30(a0)
-mflo       t6
-add        t4, t4, t6
-add        t4, t4, t3
-sra        t4, t4, 16
-sh         t4, 0x0(a2)
-lw         t3, 0x4(a0)
-mult       t0, t3
-lw         t3, 0x14(a0)
-mflo       t4
-NOP
-NOP
-mult       t1, t3
-lw         t3, 0x24(a0)
-mflo       t5
-add        t4, t4, t5
-NOP
-mult       t2, t3
-lw         t3, 0x34(a0)
-mflo       t6
-add        t4, t4, t6
-add        t4, t4, t3
-sra        t4, t4, 16
-sh         t4, 0x2(a2)
-lw         t3, 0x8(a0)
-mult       t0, t3
-lw         t3, 0x18(a0)
-mflo       t4
-NOP
-NOP
-mult       t1, t3
-lw         t3, 0x28(a0)
-mflo       t5
-add        t4, t4, t5
-NOP
-mult       t2, t3
-lw         t3, 0x38(a0)
-mflo       t6
-add        t4, t4, t6
-add        t4, t4, t3
-sra        t4, t4, 16
-jr         ra
- sh        t4, 0x4(a2)
+    lh         t0, 0x0(a1)
+    lh         t1, 0x2(a1)
+    lh         t2, 0x4(a1)
+    lw         t3, 0x0(a0)
+    mult       t0, t3
+    lw         t3, 0x10(a0)
+    mflo       t4
+    mult       t1, t3
+    lw         t3, 0x20(a0)
+    mflo       t5
+    mult       t2, t3
+    add        t4, t5
+    lw         t3, 0x30(a0)
+    mflo       t6
+    add        t4, t6
+    add        t4, t3
+    sra        t4, 16
+    sh         t4, 0x0(a1)
+    lw         t3, 0x4(a0)
+    mult       t0, t3
+    lw         t3, 0x14(a0)
+    mflo       t4
+    mult       t1, t3
+    lw         t3, 0x24(a0)
+    mflo       t5
+    add        t4, t5
+    mult       t2, t3
+    lw         t3, 0x34(a0)
+    mflo       t6
+    add        t4, t6
+    add        t4, t3
+    sra        t4, 16
+    sh         t4, 0x2(a1)
+    lw         t3, 0x8(a0)
+    mult       t0, t3
+    lw         t3, 0x18(a0)
+    mflo       t4
+    mult       t1, t3
+    lw         t3, 0x28(a0)
+    mflo       t5
+    add        t4, t5
+    mult       t2, t3
+    lw         t3, 0x38(a0)
+    mflo       t6
+    add        t4, t6
+    add        t4, t3
+    sra        t4, 16
+    sh         t4, 0x4(a1)
+    jr         ra
 END(mtxs_transform_point)
 
 LEAF(mtxs_transform_dir)
-lw         t3, 0x0(a0)
-lh         t0, 0x0(a2)
-lh         t1, 0x2(a2)
-lh         t2, 0x4(a2)
-mult       t0, t3
-lw         t3, 0x10(a0)
-mflo       t4
-NOP
-NOP
-mult       t1, t3
-lw         t3, 0x20(a0)
-mflo       t5
-add        t4, t4, t5
-NOP
-mult       t2, t3
-lw         t3, 0x4(a0)
-mflo       t6
-add        t4, t4, t6
-sra        t4, t4, 16
-mult       t0, t3
-sh         t4, 0x0(a2)
-lw         t3, 0x14(a0)
-mflo       t4
-NOP
-NOP
-mult       t1, t3
-lw         t3, 0x24(a0)
-mflo       t5
-add        t4, t4, t5
-NOP
-mult       t2, t3
-lw         t3, 0x8(a0)
-mflo       t6
-add        t4, t4, t6
-sra        t4, t4, 16
-mult       t0, t3
-sh         t4, 0x2(a2)
-lw         t3, 0x18(a0)
-mflo       t4
-NOP
-NOP
-mult       t1, t3
-lw         t3, 0x28(a0)
-mflo       t5
-add        t4, t4, t5
-NOP
-mult       t2, t3
-mflo       t6
-add        t4, t4, t6
-sra        t4, t4, 16
-jr         ra
- sh        t4, 0x4(a2)
+    lw         t3, 0x0(a0)
+    lh         t0, 0x0(a1)
+    lh         t1, 0x2(a1)
+    lh         t2, 0x4(a1)
+    mult       t0, t3
+    lw         t3, 0x10(a0)
+    mflo       t4
+    mult       t1, t3
+    lw         t3, 0x20(a0)
+    mflo       t5
+    add        t4, t5
+    mult       t2, t3
+    lw         t3, 0x4(a0)
+    mflo       t6
+    add        t4, t6
+    sra        t4, 16
+    mult       t0, t3
+    sh         t4, 0x0(a1)
+    lw         t3, 0x14(a0)
+    mflo       t4
+    mult       t1, t3
+    lw         t3, 0x24(a0)
+    mflo       t5
+    add        t4, t5
+    mult       t2, t3
+    lw         t3, 0x8(a0)
+    mflo       t6
+    add        t4, t6
+    sra        t4, 16
+    mult       t0, t3
+    sh         t4, 0x2(a1)
+    lw         t3, 0x18(a0)
+    mflo       t4
+    mult       t1, t3
+    lw         t3, 0x28(a0)
+    mflo       t5
+    add        t4, t5
+    mult       t2, t3
+    mflo       t6
+    add        t4, t6
+    sra        t4, 16
+    sh         t4, 0x4(a1)
+    jr         ra
 END(mtxs_transform_dir)
 
 LEAF(mtxf_from_transform)
-addiu      sp, sp, -0x8
-li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         ra, 0x0(sp)
-or         a3, a0, zero
-mtc1       AT, ft5
-jal        sins_s16
- lh        a0, 0x0(a2)
-mtc1       v0, fv0
-lh         a0, 0x0(a2)
-cvt.s.w    fv0, fv0
-mul.s      fv0, fv0, ft5
-jal        coss_s16
- NOP
-mtc1       v0, fv1
-lh         a0, 0x2(a2)
-cvt.s.w    fv1, fv1
-mul.s      fv1, fv1, ft5
-jal        sins_s16
- NOP
-mtc1       v0, ft0
-lh         a0, 0x2(a2)
-cvt.s.w    ft0, ft0
-mul.s      ft0, ft0, ft5
-jal        coss_s16
- NOP
-mtc1       v0, ft1
-lh         a0, 0x4(a2)
-cvt.s.w    ft1, ft1
-mul.s      ft1, ft1, ft5
-jal        sins_s16
- NOP
-mtc1       v0, ft2
-lh         a0, 0x4(a2)
-cvt.s.w    ft2, ft2
-mul.s      ft2, ft2, ft5
-jal        coss_s16
- NOP
-mtc1       v0, ft3
-lw         t2, 0x8(a2)
-sw         zero, 0xC(a3)
-cvt.s.w    ft3, ft3
-sw         zero, 0x1C(a3)
-sw         zero, 0x2C(a3)
-li.s       AT, 1.0
-mul.s      ft3, ft3, ft5
-NOP
-mul.s      ft4, ft0, fv0
-NOP
-mul.s      ft4, ft4, ft2
-NOP
-mul.s      ft5, ft3, fv1
-add.s      ft4, ft4, ft5
-mtc1       t2, ft5
-NOP
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x0(a3)
-mul.s      ft4, ft2, ft1
-NOP
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x4(a3)
-mul.s      ft4, ft0, fv1
-NOP
-mul.s      ft4, ft4, ft2
-NOP
-mul.s      ft5, ft3, fv0
-sub.s      ft4, ft4, ft5
-mtc1       t2, ft5
-NOP
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x8(a3)
-mul.s      ft4, ft0, fv0
-NOP
-mul.s      ft4, ft4, ft3
-NOP
-mul.s      ft5, ft2, fv1
-sub.s      ft4, ft4, ft5
-mtc1       t2, ft5
-NOP
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x10(a3)
-mul.s      ft4, ft3, ft1
-NOP
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x14(a3)
-mul.s      ft4, ft0, fv1
-NOP
-mul.s      ft4, ft4, ft3
-NOP
-mul.s      ft5, ft2, fv0
-add.s      ft4, ft4, ft5
-mtc1       t2, ft5
-NOP
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x18(a3)
-mul.s      ft4, ft1, fv0
-NOP
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x20(a3)
-mul.s      ft4, ft0, ft5
-neg.s      ft4, ft4
-swc1       ft4, 0x24(a3)
-mul.s      ft4, ft1, fv1
-NOP
-mul.s      ft4, ft4, ft5
-mtc1       AT, ft5
-swc1       ft4, 0x28(a3)
-lw         t0, 0xC(a2)
-sw         t0, 0x30(a3)
-lw         t0, 0x10(a2)
-sw         t0, 0x34(a3)
-lw         t0, 0x14(a2)
-swc1       ft5, 0x3C(a3)
-sw         t0, 0x38(a3)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    move       a3, a0
+    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
+    lh         a0, 0x0(a1)
+    jal        sins_s16
+    mtc1       v0, fv0
+    lh         a0, 0x0(a1)
+    cvt.s.w    fv0
+    mul.s      fv0, ft5
+    jal        coss_s16
+    mtc1       v0, fv1
+    lh         a0, 0x2(a1)
+    cvt.s.w    fv1
+    mul.s      fv1, ft5
+    jal        sins_s16
+    mtc1       v0, ft0
+    lh         a0, 0x2(a1)
+    cvt.s.w    ft0
+    mul.s      ft0, ft5
+    jal        coss_s16
+    mtc1       v0, ft1
+    lh         a0, 0x4(a1)
+    cvt.s.w    ft1
+    mul.s      ft1, ft5
+    jal        sins_s16
+    mtc1       v0, ft2
+    lh         a0, 0x4(a1)
+    cvt.s.w    ft2
+    mul.s      ft2, ft5
+    jal        coss_s16
+    mtc1       v0, ft3
+    lw         t2, 0x8(a1)
+    sw         zero, 0xC(a3)
+    cvt.s.w    ft3, ft3
+    sw         zero, 0x1C(a3)
+    sw         zero, 0x2C(a3)
+    mul.s      ft3, ft3, ft5
+    mul.s      ft4, ft0, fv0
+    mul.s      ft4, ft2
+    mul.s      ft5, ft3, fv1
+    add.s      ft4, ft5
+    mtc1       t2, ft5
+    mul.s      ft4, ft5
+    swc1       ft4, 0x0(a3)
+    mul.s      ft4, ft2, ft1
+    mul.s      ft4, ft5
+    swc1       ft4, 0x4(a3)
+    mul.s      ft4, ft0, fv1
+    mul.s      ft4, ft2
+    mul.s      ft5, ft3, fv0
+    sub.s      ft4, ft5
+    mtc1       t2, ft5
+    mul.s      ft4, ft5
+    swc1       ft4, 0x8(a3)
+    mul.s      ft4, ft0, fv0
+    mul.s      ft4, ft3
+    mul.s      ft5, ft2, fv1
+    sub.s      ft4, ft5
+    mtc1       t2, ft5
+    mul.s      ft4, ft5
+    swc1       ft4, 0x10(a3)
+    mul.s      ft4, ft3, ft1
+    mul.s      ft4, ft5
+    swc1       ft4, 0x14(a3)
+    mul.s      ft4, ft0, fv1
+    mul.s      ft4, ft3
+    mul.s      ft5, ft2, fv0
+    add.s      ft4, ft5
+    mtc1       t2, ft5
+    mul.s      ft4, ft5
+    swc1       ft4, 0x18(a3)
+    mul.s      ft4, ft1, fv0
+    mul.s      ft4, ft5
+    swc1       ft4, 0x20(a3)
+    mul.s      ft4, ft0, ft5
+    neg.s      ft4
+    swc1       ft4, 0x24(a3)
+    mul.s      ft4, ft1, fv1
+    mul.s      ft4, ft5
+    swc1       ft4, 0x28(a3)
+    lw         t0, 0xC(a1)
+    sw         t0, 0x30(a3)
+    lw         t0, 0x10(a1)
+    sw         t0, 0x34(a3)
+    lw         t0, 0x14(a1)
+    sw         t0, 0x38(a3)
+    li.s       ft5, 1.0
+    swc1       ft5, 0x3C(a3)
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(mtxf_from_transform)
 
 /* Official Name: mathSquashY */
 LEAF(mtxf_scale_y)
-mtc1       a2, ft5
-lwc1       ft4, 0x10(a0)
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x10(a0)
-lwc1       ft4, 0x14(a3)
-mul.s      ft4, ft4, ft5
-swc1       ft4, 0x14(a0)
-lwc1       ft4, 0x18(a0)
-mul.s      ft4, ft4, ft5
-jr         ra
- swc1      ft4, 0x18(a0)
+    mtc1       a1, ft5
+
+    lwc1       ft4, 0x10(a0)
+    mul.s      ft4, ft5
+    swc1       ft4, 0x10(a0)
+#ifdef AVOID_UB
+    lwc1       ft4, 0x14(a0)
+#else
+    lwc1       ft4, 0x14(a3) /* UB: Should be a0, and this was actually fixed in JFG */
+#endif
+    mul.s      ft4, ft5
+    swc1       ft4, 0x14(a0)
+
+    lwc1       ft4, 0x18(a0)
+    mul.s      ft4, ft5
+    swc1       ft4, 0x18(a0)
+
+    jr         ra
 END(mtxf_scale_y)
 
 /* Official Name: mathTransY */
 LEAF(mtxf_translate_y)
-mtc1       a2, ft4
-lwc1       fv0, 0x10(a0)
-lwc1       ft0, 0x14(a0)
-lwc1       ft2, 0x18(a0)
-mul.s      fv0, fv0, ft4
-lwc1       fv1, 0x30(a0)
-lwc1       ft1, 0x34(a0)
-mul.s      ft0, ft0, ft4
-lwc1       ft3, 0x38(a0)
-mul.s      ft2, ft2, ft4
-add.s      fv0, fv0, fv1
-add.s      ft0, ft0, ft1
-swc1       fv0, 0x30(a0)
-add.s      ft2, ft2, ft3
-swc1       ft0, 0x34(a0)
-jr         ra
- swc1      ft2, 0x38(a0)
+    mtc1       a1, ft4
+    lwc1       fv0, 0x10(a0)
+    lwc1       ft0, 0x14(a0)
+    lwc1       ft2, 0x18(a0)
+    lwc1       fv1, 0x30(a0)
+    lwc1       ft1, 0x34(a0)
+    lwc1       ft3, 0x38(a0)
+    mul.s      fv0, ft4
+    mul.s      ft0, ft4
+    mul.s      ft2, ft4
+    add.s      fv0, fv1
+    add.s      ft0, ft1
+    add.s      ft2, ft3
+    swc1       fv0, 0x30(a0)
+    swc1       ft0, 0x34(a0)
+    swc1       ft2, 0x38(a0)
+    jr         ra
 END(mtxf_translate_y)
 
 /* Official Name: mathRpyXyzMtx */
 LEAF(mtxf_from_inverse_transform)
-addiu      sp, sp, -0x8
-li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         ra, 0x0(sp)
-or         a3, a0, zero
-mtc1       AT, ft5
-jal        sins_s16
- lh        a0, 0x0(a2)
-mtc1       v0, fv0
-lh         a0, 0x0(a2)
-cvt.s.w    fv0, fv0
-mul.s      fv0, fv0, ft5
-jal        coss_s16
- NOP
-mtc1       v0, fv1
-lh         a0, 0x2(a2)
-cvt.s.w    fv1, fv1
-mul.s      fv1, fv1, ft5
-jal        sins_s16
- NOP
-mtc1       v0, ft0
-lh         a0, 0x2(a2)
-cvt.s.w    ft0, ft0
-mul.s      ft0, ft0, ft5
-jal        coss_s16
- NOP
-mtc1       v0, ft1
-lh         a0, 0x4(a2)
-cvt.s.w    ft1, ft1
-mul.s      ft1, ft1, ft5
-jal        sins_s16
- NOP
-mtc1       v0, ft2
-lh         a0, 0x4(a2)
-cvt.s.w    ft2, ft2
-mul.s      ft2, ft2, ft5
-jal        coss_s16
- NOP
-mtc1       v0, ft3
-sw         zero, 0xC(a3)
-swc1       ft0, 0x18(a3)
-cvt.s.w    ft3, ft3
-sw         zero, 0x1C(a3)
-sw         zero, 0x2C(a3)
-li.s       AT, 1.0
-mul.s      ft3, ft3, ft5
-NOP
-mul.s      ft4, ft0, ft2
-NOP
-mul.s      ft4, ft4, fv0
-NOP
-mul.s      ft5, fv1, ft3
-sub.s      ft4, ft5, ft4
-swc1       ft4, 0x0(a3)
-mul.s      ft4, ft0, ft3
-NOP
-mul.s      ft4, ft4, fv0
-NOP
-mul.s      ft5, fv1, ft2
-add.s      ft4, ft4, ft5
-swc1       ft4, 0x4(a3)
-mul.s      ft4, fv0, ft1
-neg.s      ft4, ft4
-swc1       ft4, 0x8(a3)
-mul.s      ft4, ft1, ft2
-neg.s      ft4, ft4
-swc1       ft4, 0x10(a3)
-mul.s      ft4, ft1, ft3
-swc1       ft4, 0x14(a3)
-mul.s      ft4, ft0, ft2
-NOP
-mul.s      ft4, ft4, fv1
-NOP
-mul.s      ft5, fv0, ft3
-add.s      ft4, ft4, ft5
-swc1       ft4, 0x20(a3)
-mul.s      ft4, ft0, ft3
-NOP
-mul.s      ft4, ft4, fv1
-NOP
-mul.s      ft5, fv0, ft2
-sub.s      ft4, ft5, ft4
-lwc1       ft5, 0x0(a3)
-swc1       ft4, 0x24(a3)
-mul.s      ft4, fv1, ft1
-swc1       ft4, 0x28(a3)
-lwc1       fv0, 0xC(a2)
-lwc1       fv1, 0x10(a2)
-lwc1       ft4, 0x10(a3)
-mul.s      ft5, ft5, fv0
-lwc1       ft0, 0x14(a2)
-mul.s      ft4, ft4, fv1
-add.s      ft4, ft4, ft5
-lwc1       ft5, 0x20(a3)
-mul.s      ft5, ft5, ft0
-add.s      ft4, ft4, ft5
-lwc1       ft5, 0x4(a3)
-swc1       ft4, 0x30(a3)
-mul.s      ft5, ft5, fv0
-lwc1       ft4, 0x14(a3)
-mul.s      ft4, ft4, fv1
-add.s      ft4, ft4, ft5
-lwc1       ft5, 0x24(a3)
-mul.s      ft5, ft5, ft0
-add.s      ft4, ft4, ft5
-lwc1       ft5, 0x8(a3)
-swc1       ft4, 0x34(a3)
-mul.s      ft5, ft5, fv0
-lwc1       ft4, 0x18(a3)
-mul.s      ft4, ft4, fv1
-add.s      ft4, ft4, ft5
-lwc1       ft5, 0x28(a3)
-mul.s      ft5, ft5, ft0
-add.s      ft4, ft4, ft5
-swc1       ft4, 0x38(a3)
-mtc1       AT, ft4
-NOP
-swc1       ft4, 0x3C(a3)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    move       a3, a0
+    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
+    lh         a0, 0x0(a1)
+    jal        sins_s16
+    mtc1       v0, fv0
+    cvt.s.w    fv0
+    mul.s      fv0, ft5
+    lh         a0, 0x0(a1)
+    jal        coss_s16
+    mtc1       v0, fv1
+    cvt.s.w    fv1
+    mul.s      fv1, ft5
+    lh         a0, 0x2(a1)
+    jal        sins_s16
+    mtc1       v0, ft0
+    cvt.s.w    ft0
+    mul.s      ft0, ft5
+    lh         a0, 0x2(a1)
+    jal        coss_s16
+    mtc1       v0, ft1
+    cvt.s.w    ft1
+    mul.s      ft1, ft5
+    lh         a0, 0x4(a1)
+    jal        sins_s16
+    mtc1       v0, ft2
+    cvt.s.w    ft2
+    mul.s      ft2, ft5
+    lh         a0, 0x4(a1)
+    jal        coss_s16
+    mtc1       v0, ft3
+    cvt.s.w    ft3
+    sw         zero, 0xC(a3)
+    swc1       ft0, 0x18(a3)
+    sw         zero, 0x1C(a3)
+    sw         zero, 0x2C(a3)
+    mul.s      ft3, ft5
+    mul.s      ft4, ft0, ft2
+    mul.s      ft4, fv0
+    mul.s      ft5, fv1, ft3
+    sub.s      ft4, ft5, ft4
+    swc1       ft4, 0x0(a3)
+    mul.s      ft4, ft0, ft3
+    mul.s      ft4, fv0
+    mul.s      ft5, fv1, ft2
+    add.s      ft4, ft5
+    swc1       ft4, 0x4(a3)
+    mul.s      ft4, fv0, ft1
+    neg.s      ft4
+    swc1       ft4, 0x8(a3)
+    mul.s      ft4, ft1, ft2
+    neg.s      ft4
+    swc1       ft4, 0x10(a3)
+    mul.s      ft4, ft1, ft3
+    swc1       ft4, 0x14(a3)
+    mul.s      ft4, ft0, ft2
+    mul.s      ft4, fv1
+    mul.s      ft5, fv0, ft3
+    add.s      ft4, ft5
+    swc1       ft4, 0x20(a3)
+    mul.s      ft4, ft0, ft3
+    mul.s      ft4, fv1
+    mul.s      ft5, fv0, ft2
+    sub.s      ft4, ft5, ft4
+    lwc1       ft5, 0x0(a3)
+    swc1       ft4, 0x24(a3)
+    mul.s      ft4, fv1, ft1
+    swc1       ft4, 0x28(a3)
+    lwc1       fv0, 0xC(a1)
+    lwc1       fv1, 0x10(a1)
+    lwc1       ft4, 0x10(a3)
+    mul.s      ft5, fv0
+    lwc1       ft0, 0x14(a1)
+    mul.s      ft4, fv1
+    add.s      ft4, ft5
+    lwc1       ft5, 0x20(a3)
+    mul.s      ft5, ft0
+    add.s      ft4, ft5
+    lwc1       ft5, 0x4(a3)
+    swc1       ft4, 0x30(a3)
+    mul.s      ft5, fv0
+    lwc1       ft4, 0x14(a3)
+    mul.s      ft4, fv1
+    add.s      ft4, ft5
+    lwc1       ft5, 0x24(a3)
+    mul.s      ft5, ft0
+    add.s      ft4, ft5
+    lwc1       ft5, 0x8(a3)
+    swc1       ft4, 0x34(a3)
+    mul.s      ft5, fv0
+    lwc1       ft4, 0x18(a3)
+    mul.s      ft4, fv1
+    add.s      ft4, ft5
+    lwc1       ft5, 0x28(a3)
+    mul.s      ft5, ft0
+    add.s      ft4, ft5
+    swc1       ft4, 0x38(a3)
+    li.s       ft4, 1.0
+    swc1       ft4, 0x3C(a3)
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(mtxf_from_inverse_transform)
 
 LEAF(func_80070058)
-addiu      sp, sp, -0x8
-li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         ra, 0x0(sp)
-or         a3, a0, zero
-mtc1       AT, ft5
-jal        sins_s16
- lh        a0, 0x0(a2)
-mtc1       v0, fv0
-lh         a0, 0x0(a2)
-cvt.s.w    fv0, fv0
-mul.s      fv0, fv0, ft5
-jal        coss_s16
- NOP
-mtc1       v0, fv1
-lh         a0, 0x2(a2)
-cvt.s.w    fv1, fv1
-mul.s      fv1, fv1, ft5
-jal        sins_s16
- NOP
-mtc1       v0, ft0
-lh         a0, 0x2(a2)
-cvt.s.w    ft0, ft0
-mul.s      ft0, ft0, ft5
-jal        coss_s16
- NOP
-mtc1       v0, ft1
-lh         a0, 0x4(a2)
-cvt.s.w    ft1, ft1
-mul.s      ft1, ft1, ft5
-jal        sins_s16
- NOP
-mtc1       v0, ft2
-lh         a0, 0x4(a2)
-cvt.s.w    ft2, ft2
-mul.s      ft2, ft2, ft5
-jal        coss_s16
- NOP
-mtc1       v0, ft3
-li.s       AT, 1.0
-sw         zero, 0xC(a3)
-cvt.s.w    ft3, ft3
-sw         zero, 0x1C(a3)
-sw         zero, 0x2C(a3)
-mul.s      ft3, ft3, ft5
-mtc1       AT, ft5
-mul.s      fa0, fv0, ft1
-swc1       ft5, 0x3C(a3)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-mul.s      fa1, fv1, ft3
-NOP
-mul.s      ft4, fv0, ft2
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    move       a3, a0
+    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
+    lh         a0, 0x0(a1)
+    jal        sins_s16
+    mtc1       v0, fv0
+    cvt.s.w    fv0
+    mul.s      fv0, ft5
+    lh         a0, 0x0(a1)
+    jal        coss_s16
+    mtc1       v0, fv1
+    cvt.s.w    fv1
+    mul.s      fv1, ft5
+    lh         a0, 0x2(a1)
+    jal        sins_s16
+    mtc1       v0, ft0
+    cvt.s.w    ft0
+    mul.s      ft0, ft5
+    lh         a0, 0x2(a1)
+    jal        coss_s16
+    mtc1       v0, ft1
+    cvt.s.w    ft1
+    mul.s      ft1, ft5
+    lh         a0, 0x4(a1)
+    jal        sins_s16
+    mtc1       v0, ft2
+    cvt.s.w    ft2
+    mul.s      ft2, ft5
+    lh         a0, 0x4(a1)
+    jal        coss_s16
+    sw         zero, 0xC(a3)
+    sw         zero, 0x1C(a3)
+    sw         zero, 0x2C(a3)
+    mtc1       v0, ft3
+    cvt.s.w    ft3
+    mul.s      ft3, ft5
+    li.s       ft5, 1.0
+    swc1       ft5, 0x3C(a3)
+    mul.s      fa0, fv0, ft1
+    mul.s      fa1, fv1, ft3
+    mul.s      ft4, fv0, ft2
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(func_80070058)
 
 LEAF(mtxf_billboard)
-addiu      sp, sp, -0x8
-or         t9, a3, zero
-li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         ra, 0x0(sp)
-or         a3, a0, zero
-mtc1       AT, ft5
-jal        sins_s16
- or        a0, a2, zero
-mtc1       v0, ft2
-or         a0, a2, zero
-cvt.s.w    ft2, ft2
-mul.s      ft2, ft2, ft5
-jal        coss_s16
- NOP
-mtc1       v0, ft3
-mtc1       a2, ft4
-li.s       AT, 1.0
-cvt.s.w    ft3, ft3
-swc1       ft4, 0x28(a3)
-sw         zero, 0x8(a3)
-sw         zero, 0xC(a3)
-sw         zero, 0x18(a3)
-sw         zero, 0x1C(a3)
-mul.s      ft3, ft3, ft5
-mtc1       t9, ft5
-sw         zero, 0x20(a3)
-sw         zero, 0x24(a3)
-sw         zero, 0x2C(a3)
-sw         zero, 0x30(a3)
-sw         zero, 0x34(a3)
-mul.s      ft3, ft3, ft4
-sw         zero, 0x38(a3)
-mul.s      ft2, ft2, ft4
-mtc1       AT, ft4
-swc1       ft3, 0x0(a3)
-mul.s      ft3, ft3, ft5
-swc1       ft4, 0x3C(a3)
-swc1       ft2, 0x4(a3)
-neg.s      ft2, ft2
-swc1       ft2, 0x10(a3)
-swc1       ft3, 0x14(a3)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    move       t9, a3
+    move       a3, a0
+    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
+    move       a0, a1
+    jal        sins_s16
+    mtc1       v0, ft2
+    move       a0, a1
+    cvt.s.w    ft2
+    mul.s      ft2, ft5
+    jal        coss_s16
+    mtc1       v0, ft3
+    mtc1       a2, ft4
+    cvt.s.w    ft3
+    sw         zero, 0x8(a3)
+    sw         zero, 0xC(a3)
+    sw         zero, 0x18(a3)
+    sw         zero, 0x1C(a3)
+    swc1       ft4, 0x28(a3)
+    mul.s      ft3, ft5
+    mtc1       t9, ft5
+    sw         zero, 0x20(a3)
+    sw         zero, 0x24(a3)
+    sw         zero, 0x2C(a3)
+    sw         zero, 0x30(a3)
+    sw         zero, 0x34(a3)
+    sw         zero, 0x38(a3)
+    mul.s      ft3, ft4
+    mul.s      ft2, ft4
+    li.s       ft4, 1.0
+    swc1       ft3, 0x0(a3)
+    swc1       ft2, 0x4(a3)
+    swc1       ft4, 0x3C(a3)
+    mul.s      ft3, ft5
+    neg.s      ft2, ft2
+    swc1       ft2, 0x10(a3)
+    swc1       ft3, 0x14(a3)
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(mtxf_billboard)
 
 LEAF(vec3s_rotate_rpy)
-addiu      sp, sp, -0x8
-sd         ra, 0x0(sp)
-or         a2, a0, zero
-lh         t3, 0x0(a2)
-lh         t4, 0x2(a2)
-lh         t5, 0x4(a2)
-jal        sins_s16
- lh        a0, 0x0(a2)
-or         t6, v0, zero
-jal        coss_s16
- lh        a0, 0x0(a2)
-mult       t3, t6
-or         t7, v0, zero
-lh         a0, 0x2(a2)
-mflo       t0
-NOP
-NOP
-mult       t4, t6
-mflo       t1
-NOP
-NOP
-mult       t3, t7
-mflo       t3
-sub        t3, t3, t1
-sra        t3, t3, 16
-mult       t4, t7
-mflo       t4
-add        t4, t4, t0
-jal        sins_s16
- sra       t4, t4, 16
-or         t6, v0, zero
-jal        coss_s16
- lh        a0, 0x2(a2)
-mult       t4, t6
-or         t7, v0, zero
-lh         a0, 0x4(a2)
-mflo       t0
-NOP
-NOP
-mult       t5, t6
-mflo       t1
-NOP
-NOP
-mult       t4, t7
-mflo       t4
-sub        t4, t4, t1
-sra        t4, t4, 16
-mult       t5, t7
-mflo       t5
-add        t5, t5, t0
-jal        sins_s16
- sra       t5, t5, 16
-or         t6, v0, zero
-jal        coss_s16
- lh        a0, 0x4(a2)
-mult       t3, t6
-or         t7, v0, zero
-sh         t4, 0x2(a2)
-mflo       t0
-NOP
-NOP
-mult       t5, t6
-mflo       t1
-NOP
-NOP
-mult       t3, t7
-mflo       t3
-add        t3, t3, t1
-sra        t3, t3, 16
-mult       t5, t7
-sh         t3, 0x0(a2)
-mflo       t5
-sub        t5, t5, t0
-sra        t5, t5, 16
-sh         t5, 0x4(a2)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    move       a2, a0
+    lh         t3, 0x0(a1)
+    lh         t4, 0x2(a1)
+    lh         t5, 0x4(a1)
+    lh         a0, 0x0(a2)
+    jal        sins_s16
+    move       t6, v0
+    lh         a0, 0x0(a2)
+    jal        coss_s16
+    mult       t3, t6
+    move       t7, v0
+    mflo       t0
+    mult       t4, t6
+    mflo       t1
+    mult       t3, t7
+    mflo       t3
+    sub        t3, t1
+    sra        t3, 16
+    mult       t4, t7
+    mflo       t4
+    add        t4, t0
+    sra        t4, 16
+    lh         a0, 0x2(a2)
+    jal        sins_s16
+    move       t6, v0
+    lh         a0, 0x2(a2)
+    jal        coss_s16
+    mult       t4, t6
+    move       t7, v0
+    mflo       t0
+    mult       t5, t6
+    mflo       t1
+    mult       t4, t7
+    mflo       t4
+    sub        t4, t1
+    sra        t4, 16
+    mult       t5, t7
+    mflo       t5
+    add        t5, t0
+    sra        t5, 16
+    lh         a0, 0x4(a2)
+    jal        sins_s16
+    move       t6, v0
+    lh         a0, 0x4(a2)
+    jal        coss_s16
+    mult       t3, t6
+    move       t7, v0
+    mflo       t0
+    mult       t5, t6
+    mflo       t1
+    mult       t3, t7
+    mflo       t3
+    add        t3, t1
+    sra        t3, 16
+    mult       t5, t7
+    mflo       t5
+    sub        t5, t0
+    sra        t5, 16
+    sh         t3, 0x0(a1)
+    sh         t4, 0x2(a1)
+    sh         t5, 0x4(a1)
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(vec3s_rotate_rpy)
 
 /* Official Name: mathOneFloatRPY */
 LEAF(vec3f_rotate)
-addiu      sp, sp, -0x8
-sd         ra, 0x0(sp)
-or         a2, a0, zero
-lwc1       ft0, 0x0(a2)
-lwc1       ft1, 0x4(a2)
-lwc1       ft2, 0x8(a2)
-jal        sins_f
- lh        a0, 0x4(a2)
-mul.s      ft3, ft0, fv0
-lh         a0, 0x4(a2)
-mul.s      fa0, ft1, fv0
-jal        coss_f
- NOP
-mul.s      ft0, ft0, fv0
-lh         a0, 0x2(a2)
-mul.s      ft1, ft1, fv0
-sub.s      ft0, ft0, fa0
-jal        sins_f
- add.s     ft1, ft1, ft3
-mul.s      ft3, ft1, fv0
-lh         a0, 0x2(a2)
-mul.s      fa0, ft2, fv0
-jal        coss_f
- NOP
-mul.s      ft1, ft1, fv0
-lh         a0, 0x0(a2)
-mul.s      ft2, ft2, fv0
-sub.s      ft1, ft1, fa0
-jal        sins_f
- add.s     ft2, ft2, ft3
-mul.s      ft3, ft0, fv0
-lh         a0, 0x0(a2)
-mul.s      fa0, ft2, fv0
-jal        coss_f
- NOP
-mul.s      ft0, ft0, fv0
-swc1       ft1, 0x4(a2)
-mul.s      ft2, ft2, fv0
-add.s      ft0, ft0, fa0
-sub.s      ft2, ft2, ft3
-swc1       ft0, 0x0(a2)
-swc1       ft2, 0x8(a2)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    lwc1       ft0, 0x0(a1)
+    lwc1       ft1, 0x4(a1)
+    lwc1       ft2, 0x8(a1)
+    move       a2, a0
+    lh         a0, 0x4(a2)
+    jal        sins_f
+    mul.s      ft3, ft0, fv0
+    mul.s      fa0, ft1, fv0
+    lh         a0, 0x4(a2)
+    jal        coss_f
+    mul.s      ft0, fv0
+    lh         a0, 0x2(a2)
+    mul.s      ft1, fv0
+    sub.s      ft0, fa0
+    add.s      ft1, ft3
+    jal        sins_f
+    mul.s      ft3, ft1, fv0
+    mul.s      fa0, ft2, fv0
+    lh         a0, 0x2(a2)
+    jal        coss_f
+    mul.s      ft1, fv0
+    lh         a0, 0x0(a2)
+    mul.s      ft2, fv0
+    sub.s      ft1, fa0
+    add.s      ft2, ft3
+    jal        sins_f
+    mul.s      ft3, ft0, fv0
+    mul.s      fa0, ft2, fv0
+    lh         a0, 0x0(a2)
+    jal        coss_f
+    mul.s      ft0, fv0
+    swc1       ft1, 0x4(a1)
+    mul.s      ft2, fv0
+    add.s      ft0, fa0
+    sub.s      ft2, ft3
+    swc1       ft0, 0x0(a1)
+    swc1       ft2, 0x8(a1)
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(vec3f_rotate)
 
 /* Official Name: mathOneFloatYPR */
 LEAF(vec3f_rotate_ypr)
-addiu      sp, sp, -0x8
-sd         ra, 0x0(sp)
-or         a2, a0, zero
-lwc1       ft0, 0x0(a2)
-lwc1       ft1, 0x4(a2)
-lwc1       ft2, 0x8(a2)
-jal        sins_f
- lh        a0, 0x0(a2)
-mul.s      ft3, ft0, fv0
-lh         a0, 0x0(a2)
-mul.s      fa0, ft2, fv0
-jal        coss_f
- NOP
-mul.s      ft0, ft0, fv0
-lh         a0, 0x2(a2)
-mul.s      ft2, ft2, fv0
-add.s      ft0, ft0, fa0
-jal        sins_f
- sub.s     ft2, ft2, ft3
-mul.s      ft3, ft1, fv0
-lh         a0, 0x2(a2)
-mul.s      fa0, ft2, fv0
-jal        coss_f
- NOP
-mul.s      ft1, ft1, fv0
-lh         a0, 0x4(a2)
-mul.s      ft2, ft2, fv0
-sub.s      ft1, ft1, fa0
-jal        sins_f
- add.s     ft2, ft2, ft3
-mul.s      ft3, ft0, fv0
-lh         a0, 0x4(a2)
-mul.s      fa0, ft1, fv0
-jal        coss_f
- NOP
-mul.s      ft0, ft0, fv0
-swc1       ft2, 0x8(a2)
-mul.s      ft1, ft1, fv0
-sub.s      ft0, ft0, fa0
-add.s      ft1, ft1, ft3
-swc1       ft0, 0x0(a2)
-swc1       ft1, 0x4(a2)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    lwc1       ft0, 0x0(a1)
+    lwc1       ft1, 0x4(a1)
+    lwc1       ft2, 0x8(a1)
+    move       a2, a0
+    lh         a0, 0x0(a2)
+    jal        sins_f
+    mul.s      ft3, ft0, fv0
+    mul.s      fa0, ft2, fv0
+    lh         a0, 0x0(a2)
+    jal        coss_f
+    mul.s      ft0, fv0
+    lh         a0, 0x2(a2)
+    mul.s      ft2, fv0
+    add.s      ft0, fa0
+    sub.s      ft2, ft3
+    jal        sins_f
+    mul.s      ft3, ft1, fv0
+    mul.s      fa0, ft2, fv0
+    lh         a0, 0x2(a2)
+    jal        coss_f
+    mul.s      ft1, fv0
+    lh         a0, 0x4(a2)
+    mul.s      ft2, fv0
+    sub.s      ft1, fa0
+    add.s      ft2, ft3
+    jal        sins_f
+    mul.s      ft3, ft0, fv0
+    mul.s      fa0, ft1, fv0
+    lh         a0, 0x4(a2)
+    jal        coss_f
+    mul.s      ft0, fv0
+    swc1       ft2, 0x8(a1)
+    mul.s      ft1, fv0
+    sub.s      ft0, fa0
+    add.s      ft1, ft3
+    swc1       ft0, 0x0(a1)
+    swc1       ft1, 0x4(a1)
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(vec3f_rotate_ypr)
 
 /* Official Name: mathOneFloatPY */
 LEAF(vec3f_rotate_py)
-addiu      sp, sp, -0x8
-sd         ra, 0x0(sp)
-or         a2, a0, zero
-lwc1       ft2, 0x8(a2)
-jal        sins_f
- lh        a0, 0x2(a2)
-mul.s      ft1, ft2, fv0
-jal        coss_f
- lh        a0, 0x2(a2)
-mul.s      ft2, ft2, fv0
-neg.s      ft1, ft1
-jal        sins_f
- lh        a0, 0x0(a2)
-mul.s      ft0, ft2, fv0
-jal        coss_f
- lh        a0, 0x0(a2)
-mul.s      ft2, ft2, fv0
-swc1       ft0, 0x0(a2)
-swc1       ft1, 0x4(a2)
-swc1       ft2, 0x8(a2)
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    move       a2, a0
+    lwc1       ft2, 0x8(a1)
+    lh         a0, 0x2(a2)
+    jal        sins_f
+    mul.s      ft1, ft2, fv0
+    lh         a0, 0x2(a2)
+    jal        coss_f
+    neg.s      ft1
+    mul.s      ft2, fv0
+    lh         a0, 0x0(a2)
+    jal        sins_f
+    mul.s      ft0, ft2, fv0
+    lh         a0, 0x0(a2)
+    jal        coss_f
+    mul.s      ft2, fv0
+    swc1       ft0, 0x0(a1)
+    swc1       ft1, 0x4(a1)
+    swc1       ft2, 0x8(a1)
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(vec3f_rotate_py)
 
 /* Official Name: mathXZInTri */
 LEAF(tri2d_xz_contains_point)
+.set noreorder
 lw         t6, 0x10(sp)
 lh         t0, 0x0(a2)
 lh         t1, 0x4(a2)
@@ -1301,278 +1197,270 @@ sub        t6, a0, t0
 sub        t7, t3, t1
 multu      t6, t7
 lh         t2, 0x0(a3)
-sub        t9, a2, t1
+sub        t9, a1, t1
 addiu      v0, zero, 0x0
 sub        t8, t2, t0
 ori        a3, zero, 0x1
 mflo       t6
 mflo       t6
-NOP
-NOP
+nop
+nop
 multu      t8, t9
 mflo       t7
 mflo       t8
 sub        t6, t6, t7
 bgezl      t6, .L80070558
- sub       t6, a0, t2
+.set reorder
+sub        t6, a0, t2
 xor        a3, a3, a3
 sub        t6, a0, t2
 .L80070558:
 sub        t7, t5, t3
 multu      t6, t7
 sub        t8, t4, t2
-sub        t9, a2, t3
+sub        t9, a1, t3
 ori        a2, zero, 0x1
 mflo       t6
 mflo       t6
-NOP
-NOP
 multu      t8, t9
 mflo       t7
 mflo       t8
 sub        t6, t6, t7
 bgez       t6, .L80070598
- NOP
 xor        a2, a2, a2
 .L80070598:
 bne        a3, a2, .L800705F0
- NOP
 sub        t6, a0, t4
 sub        t7, t1, t5
 multu      t6, t7
 sub        t8, t0, t4
-sub        t9, a2, t5
-ori        a2, zero, 0x1
+sub        t9, a1, t5
+ori        a1, zero, 0x1
 mflo       t6
 mflo       t6
-NOP
-NOP
 multu      t8, t9
 mflo       t7
 mflo       t8
 sub        t6, t6, t7
 bgez       t6, .L800705E4
- NOP
-xor        a2, a2, a2
+xor        a1, a1, a1
 .L800705E4:
-bne        a2, a2, .L800705F0
- NOP
+bne        a1, a2, .L800705F0
 ori        v0, zero, 0x1
 .L800705F0:
 jr         ra
- NOP
 END(tri2d_xz_contains_point)
 
 /* Official Name: mathTranslateMtx */
 LEAF(mtxf_from_translation)
-or         t0, a0, zero
-addiu      t1, t0, 0x40
-.L80070600:
-addiu      t0, t0, 0x4
-bne        t1, t0, .L80070600
- sw        zero, -0x4(t0)
-li.s       AT, 1.0
-mtc1       AT, ft5
-NOP
-swc1       ft5, 0x0(a0)
-swc1       ft5, 0x14(a0)
-swc1       ft5, 0x28(a0)
-swc1       ft5, 0x3C(a0)
-sw         a2, 0x30(a0)
-sw         a2, 0x34(a0)
-jr         ra
- sw        a3, 0x38(a0)
+    /* Clear matrix */
+    move       t0, a0
+    addiu      t1, t0, 0x40
+    .L80070600:
+    sw         zero, 0(t0)
+    addiu      t0, 4
+    bne        t1, t0, .L80070600
+
+    .set noreorder
+    li.s       ft5, 1.0
+    nop
+    .set reorder
+    swc1       ft5, 0x0(a0)
+    swc1       ft5, 0x14(a0)
+    swc1       ft5, 0x28(a0)
+    swc1       ft5, 0x3C(a0)
+    sw         a1, 0x30(a0)
+    sw         a2, 0x34(a0)
+    sw         a3, 0x38(a0)
+    jr         ra
 END(mtxf_from_translation)
 
 /* Official Name: mathScaleMtx */
 LEAF(mtxf_from_scale)
-or         t0, a0, zero
-addiu      t1, t0, 0x40
-.L80070640:
-addiu      t0, t0, 0x4
-bne        t1, t0, .L80070640
- sw        zero, -0x4(t0)
-li.s       AT, 1.0
-mtc1       AT, ft5
-NOP
-swc1       ft5, 0x3C(a0)
-sw         a2, 0x0(a0)
-sw         a2, 0x14(a0)
-jr         ra
- sw        a3, 0x28(a0)
+    /* Clear matrix */
+    move       t0, a0
+    addiu      t1, t0, 0x40
+    .L80070640:
+    sw         zero, 0(t0)
+    addiu      t0, 4
+    bne        t1, t0, .L80070640
+
+    .set noreorder
+    li.s       ft5, 1.0
+    nop
+    .set reorder
+    swc1       ft5, 0x3C(a0)
+    sw         a1, 0x0(a0)
+    sw         a2, 0x14(a0)
+    sw         a3, 0x28(a0)
+    jr         ra
 END(mtxf_from_scale)
 
 LEAF(atan2s)
-or         t0, a0, a2
-bne        zero, t0, .L80070680
- NOP
-jr         ra
- addiu     v0, zero, 0x0
-.L80070680:
-bltz       a0, .L80070698
- NOP
-bltzl      a2, .L800706B8
- negu      a2, a2
-j          .L800706C8
- addiu     v0, zero, 0x0
-.L80070698:
-bltz       a2, .L800706A8
- negu      a0, a0
-j          .L800706BC
- ori       v0, zero, 0xC000
-.L800706A8:
-negu       a2, a2
-j          .L800706C8
- ori       v0, zero, 0x8000
-negu       a2, a2
-.L800706B8:
-addiu      v0, zero, 0x4000
-.L800706BC:
-xor        a0, a0, a2
-xor        a2, a0, a2
-xor        a0, a0, a2
-.L800706C8:
-subu       t0, a0, a2
-bltzl      t0, .L80070718
- dsll      t0, a0, 11
-dsll       t0, a2, 11
-ddivu      zero, t0, a0
-lui        t1, %hi(gArcTanTable)
-addiu      t1, t1, %lo(gArcTanTable)
-addiu      v0, v0, 0x4000
-bnez       a0, .L800706F4
- NOP
-break      7
-.L800706F4:
-mflo       t0
-mflo       t0
-andi       t0, t0, 0xFFE
-addu       t1, t1, t0
-lh         t0, 0x0(t1)
-subu       v0, v0, t0
-jr         ra
- andi      v0, v0, 0xFFFF
-dsll       t0, a0, 11
-.L80070718:
-ddivu      zero, t0, a2
-lui        t1, %hi(gArcTanTable)
-addiu      t1, t1, %lo(gArcTanTable)
-bnez       a2, .L80070730
- NOP
-break      7
-.L80070730:
-mflo       t0
-mflo       t0
-andi       t0, t0, 0xFFE
-addu       t1, t1, t0
-lh         t0, 0x0(t1)
-addu       v0, v0, t0
-jr         ra
- andi      v0, v0, 0xFFFF
+    or         t0, a0, a1
+    bne        zero, t0, .L80070680
+    li         v0, 0x0
+    jr         ra
+    .L80070680:
+    bltz       a0, .L80070698
+    .set noreorder
+    bltzl      a1, .L800706B8
+    .set reorder
+    negu       a1
+    li         v0, 0x0
+    j          .L800706C8
+    .L80070698:
+    negu       a0
+    bltz       a1, .L800706A8
+    ori        v0, zero, 0xC000
+    j          .L800706BC
+    .L800706A8:
+    negu       a1
+    ori        v0, zero, 0x8000
+    j          .L800706C8
+    negu       a1
+    .L800706B8:
+    li         v0, 0x4000
+    .L800706BC:
+    xor        a0, a1
+    xor        a1, a0, a1
+    xor        a0, a1
+    .L800706C8:
+    subu       t0, a0, a1
+    .set noreorder
+    bltzl      t0, .L80070718
+    .set reorder
+    dsll       t0, a0, 11
+    dsll       t0, a1, 11
+    ddivu      zero, t0, a0
+    .set noreorder
+    la         t1, gArcTanTable
+    addiu      v0, 0x4000
+    bnez       a0, .L800706F4
+    nop
+    .set reorder
+    break      7
+    .L800706F4:
+    mflo       t0
+    mflo       t0
+    andi       t0, 0xFFE
+    addu       t1, t0
+    lh         t0, 0x0(t1)
+    subu       v0, t0
+    andi       v0, 0xFFFF
+    jr         ra
+    dsll       t0, a0, 11
+    .L80070718:
+    ddivu      zero, t0, a1
+    .set noreorder
+    la         t1, gArcTanTable
+    bnez       a1, .L80070730
+    nop
+    .set reorder
+    break      7
+    .L80070730:
+    mflo       t0
+    mflo       t0
+    andi       t0, 0xFFE
+    addu       t1, t0
+    lh         t0, 0x0(t1)
+    addu       v0, t0
+    andi       v0, 0xFFFF
+    jr         ra
 END(atan2s)
 
 LEAF(arctan2_f)
-li.s       AT, 255.0
-mtc1       AT, fv0
-NOP
-mul.s      fa0, fa0, fv0
-NOP
-mul.s      fa1, fa1, fv0
-cvt.w.s    fa0, fa0
-cvt.w.s    fa1, fa1
-mfc1       a0, fa0
-mfc1       a2, fa1
-j          atan2s
- NOP
+    li.s       fv0, 255.0
+    mul.s      fa0, fv0
+    mul.s      fa1, fv0
+    cvt.w.s    fa0
+    cvt.w.s    fa1
+    mfc1       a0, fa0
+    mfc1       a1, fa1
+    j          atan2s
 END(arctan2_f)
 
 LEAF(fix32_sqrt)
-mtc1       a0, fv0
-li.s       AT, 65536.0
-mtc1       AT, fv1
-cvt.s.w    fv0, fv0
-div.s      fv0, fv0, fv1
-sqrt.s     fv0, fv0
-mul.s      fv0, fv0, fv1
-cvt.w.s    fv0, fv0
-mfc1       v0, fv0
-jr         ra
- NOP
+    mtc1       a0, fv0
+    li.s       fv1, 65536.0
+    cvt.s.w    fv0
+    div.s      fv0, fv1
+    sqrt.s     fv0
+    mul.s      fv0, fv1
+    cvt.w.s    fv0
+    mfc1       v0, fv0
+    jr         ra
 END(fix32_sqrt)
 
 LEAF(bad_int_sqrt)
-mtc1       a0, fv0
-NOP
-sqrt.s     fv0, fv0
-mfc1       v0, fv0
-jr         ra
- NOP
+    mtc1       a0, fv0
+    sqrt.s     fv0
+    mfc1       v0, fv0
+    jr         ra
 END(bad_int_sqrt)
 
 LEAF(sins_f)
-addiu      sp, sp, -0x8
-sd         ra, 0x0(sp)
-jal        sins_s16
- NOP
-mtc1       v0, fv0
-li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
-mtc1       AT, fv1
-cvt.s.w    fv0, fv0
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-mul.s      fv0, fv0, fv1
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    jal        sins_s16
+    mtc1       v0, fv0
+    li.s       fv1, 0.0000152587890625 /* (1.0f / 0x10000) */
+    cvt.s.w    fv0
+    mul.s      fv0, fv1
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(sins_f)
 
 LEAF(coss_f)
-addiu      sp, sp, -0x8
-sd         ra, 0x0(sp)
-jal        coss_s16
- NOP
-mtc1       v0, fv0
-li.s       AT, 0.0000152587890625 /* (1.0f / 0x10000) */
-mtc1       AT, fv1
-cvt.s.w    fv0, fv0
-ld         ra, 0x0(sp)
-addiu      sp, sp, 0x8
-mul.s      fv0, fv0, fv1
-jr         ra
- NOP
+    addiu      sp, sp, -0x8
+    sd         ra, 0x0(sp)
+
+    jal        coss_s16
+    mtc1       v0, fv0
+    li.s       fv1, 0.0000152587890625 /* (1.0f / 0x10000) */
+    cvt.s.w    fv0
+    mul.s      fv0, fv1
+
+    ld         ra, 0x0(sp)
+    addiu      sp, sp, 0x8
+    jr         ra
 END(coss_f)
 
 /* Official Name: mathCosInterp */
 LEAF(coss_s16)
-addiu      a0, a0, 0x4000
-/* Fall through */
+    addiu      a0, a0, 0x4000
+    /* Fall through */
 
 /* Official Name: mathSinInterp */
 XLEAF(sins_s16)
-sll        v0, a0, 17
-bgezl      v0, .L80070844
-srl        t2, a0, 3
-xori       a0, a0, 0x7FFF
-srl        t2, a0, 3
-.L80070844:
-lui        v0, %hi(gSineTable)
-andi       t2, t2, 0x7FE
-addiu      v0, v0, %lo(gSineTable)
-addu       v0, v0, t2
-lhu        t2, 0x2(v0)
-lhu        v0, 0x0(v0)
-andi       t1, a0, 0xF
-sll        a0, a0, 16
-subu       t2, t2, v0
-multu      t2, t1
-sll        v0, v0, 1
-mflo       t2
-srl        t2, t2, 3
-bgez       a0, .L80070884
- addu      v0, v0, t2
-negu       v0, v0
-.L80070884:
-jr         ra
-NOP
+    sll        v0, a0, 17
+    .set noreorder
+    bgezl      v0, .L80070844
+    .set reorder
+    srl        t2, a0, 3
+    xori       a0, 0x7FFF
+    srl        t2, a0, 3
+    .L80070844:
+    andi       t2, 0x7FE
+    la         v0, gSineTable
+    addu       v0, t2
+    lhu        t2, 0x2(v0)
+    lhu        v0, 0x0(v0)
+    andi       t1, a0, 0xF
+    sll        a0, 16
+    subu       t2, v0
+    multu      t2, t1
+    sll        v0, 1
+    mflo       t2
+    srl        t2, 3
+    addu       v0, t2
+    bgez       a0, .L80070884
+    negu       v0
+    .L80070884:
+    jr         ra
 END(coss_s16)
 #ifdef MODERN_CC
 .size sins_s16, . - sins_s16
@@ -1580,201 +1468,185 @@ END(coss_s16)
 
 /* Official Name: mathCos */
 LEAF(coss_2)
-addiu      a0, a0, 0x4000
-/* Fall through */
+    addiu      a0, a0, 0x4000
+    /* Fall through */
 
 /* Official Name: mathSin */
 XLEAF(sins_2)
-sll        v0, a0, 17
-bgezl      v0, .L800708A4
-srl        t2, a0, 3
-xori       a0, a0, 0x7FFF
-srl        t2, a0, 3
-.L800708A4:
-lui        v0, %hi(gSineTable)
-andi       t2, t2, 0x7FE
-addiu      v0, v0, %lo(gSineTable)
-addu       v0, v0, t2
-lhu        v0, 0x0(v0)
-sll        a0, a0, 16
-bgez       a0, .L800708C8
-sll       v0, v0, 1
-negu       v0, v0
-.L800708C8:
-jr         ra
-NOP
+    sll        v0, a0, 17
+    .set noreorder
+    bgezl      v0, .L800708A4
+    .set reorder
+    srl        t2, a0, 3
+    xori       a0, a0, 0x7FFF
+    srl        t2, a0, 3
+    .L800708A4:
+    andi       t2, 0x7FE
+    la         v0, gSineTable
+    addu       v0, t2
+    lhu        v0, 0x0(v0)
+    sll        v0, 1
+    sll        a0, 16
+    bgez       a0, .L800708C8
+    negu       v0
+    .L800708C8:
+    jr         ra
 END(coss_2)
 #ifdef MODERN_CC
 .size sins_2, . - sins_2
 #endif
 
 LEAF(calc_dyn_lighting_for_level_segment)
-lw         t1, 0x0(a2)
-lw         t2, 0x4(a2)
-lw         t3, 0x8(a2)
-lhu        t0, 0x20(a0)
-lw         a2, 0xC(a0)
-lw         a2, 0x2C(a0)
-lw         a0, 0x0(a0)
-xor        v0, v0, v0
-.L800708F0:
-lbu        t4, 0x6(a2)
-addiu      t4, t4, -0xFF
-beql       t4, zero, .L80070A08
- lhu       t4, 0x2(a2)
-beql       v0, zero, .L80070934
- NOP
-ori        t4, zero, 0xA
-multu      v0, t4
-ori        t5, zero, 0xA
-mflo       t4
-addu       a0, a0, t4
-NOP
-multu      v0, t5
-xor        v0, v0, v0
-mflo       t5
-addu       a2, a2, t5
-NOP
-.L80070934:
-lhu        t5, 0x2(a2)
-lhu        t4, 0xE(a2)
-addiu      a2, a2, 0xC
-subu       t4, t4, t5
-.L80070944:
-lh         t5, 0x0(a2)
-lh         t6, 0x2(a2)
-lh         t7, 0x4(a2)
-mult       t5, t1
-lbu        t8, 0x7(a2)
-lbu        a3, 0x6(a2)
-lbu        t9, 0x8(a2)
-sll        t8, t8, 16
-lbu        v1, 0x9(a2)
-or         t8, a3, t8
-mflo       t5
-NOP
-NOP
-mult       t6, t2
-mflo       t6
-add        t5, t5, t6
-NOP
-mult       t7, t3
-mflo       t7
-add        t5, t5, t7
-blez       t5, .L800709B4
- NOP
-srl        t5, t5, 22
-addu       v1, v1, t5
-sltiu      t5, v1, 0x81
-bnez       t5, .L800709B4
- NOP
-ori        v1, zero, 0x80
-.L800709B4:
-multu      v1, t8
-addiu      a2, a2, 0xA
-addiu      t4, t4, -0x1
-addiu      a0, a0, 0xA
-mflo       t8
-srl        t8, t8, 7
-sb         t8, -0x4(a0)
-multu      v1, t9
-srl        t8, t8, 16
-sb         t8, -0x3(a0)
-mflo       t9
-srl        t9, t9, 7
-sb         t9, -0x2(a0)
-bnel       t4, zero, .L80070944
- NOP
-addiu      t0, t0, -0x1
-bnel       t0, zero, .L800708F0
- NOP
-jr         ra
- NOP
+    lw         t1, 0x0(a1)
+    lw         t2, 0x4(a1)
+    lw         t3, 0x8(a1)
+    lhu        t0, 0x20(a0)
+    lw         a2, 0xC(a0)
+    lw         a1, 0x2C(a0)
+    lw         a0, 0x0(a0)
+    xor        v0, v0
+    .L800708F0:
+    lbu        t4, 0x6(a2)
+    addiu      t4, -0xFF
+    .set noreorder
+    beqzl      t4, .L80070A08
+    .set reorder
+    lhu        t4, 0x2(a2)
+    beql       v0, zero, .L80070934
+    ori        t4, zero, 0xA
+    multu      v0, t4
+    ori        t5, zero, 0xA
+    mflo       t4
+    addu       a0, t4
+    multu      v0, t5
+    xor        v0, v0
+    mflo       t5
+    addu       a1, t5
+    .L80070934:
+    lhu        t5, 0x2(a2)
+    lhu        t4, 0xE(a2)
+    addiu      a2, 0xC
+    subu       t4, t5
+    .L80070944:
+    lh         t5, 0x0(a1)
+    lh         t6, 0x2(a1)
+    lh         t7, 0x4(a1)
+    lbu        t8, 0x7(a1)
+    lbu        a3, 0x6(a1)
+    lbu        t9, 0x8(a1)
+    lbu        v1, 0x9(a1)
+    sll        t8, 16
+    or         t8, a3, t8
+    mult       t5, t1
+    mflo       t5
+    mult       t6, t2
+    mflo       t6
+    add        t5, t6
+    mult       t7, t3
+    mflo       t7
+    add        t5, t7
+    blez       t5, .L800709B4
+    srl        t5, 22
+    addu       v1, t5
+    sltiu      t5, v1, 0x81
+    bnez       t5, .L800709B4
+    ori        v1, zero, 0x80
+    .L800709B4:
+    multu      v1, t8
+    addiu      a1, 0xA
+    addiu      t4, -0x1
+    addiu      a0, 0xA
+    mflo       t8
+    srl        t8, 7
+    sb         t8, -0x4(a0)
+    multu      v1, t9
+    srl        t8, 16
+    sb         t8, -0x3(a0)
+    mflo       t9
+    srl        t9, 7
+    sb         t9, -0x2(a0)
+    bnel       t4, zero, .L80070944
+    addiu      t0, t0, -0x1
+    bnel       t0, zero, .L800708F0
+    jr         ra
 END(calc_dyn_lighting_for_level_segment)
 
 LEAF(func_80070A04)
-lhu        t4, 0x2(a2)
-.L80070A08:
-lhu        t5, 0xE(a2)
-addiu      a2, a2, 0xC
-addiu      t0, t0, -0x1
-subu       t4, t5, t4
-addu       v0, v0, t4
-bnel       t0, zero, .L800708F0
- NOP
-jr         ra
- NOP
+    lhu        t4, 0x2(a2)
+    .L80070A08:
+    lhu        t5, 0xE(a2)
+    addiu      a2, 0xC
+    addiu      t0, -0x1
+    subu       t4, t5, t4
+    addu       v0, t4
+    bnel       t0, zero, .L800708F0
+    jr         ra
 END(func_80070A04)
 
 LEAF(area_triangle_2d)
-mtc1       a2, ft0
-mov.s      fv0, fa0
-mtc1       a3, ft1
-sub.s      fa0, ft0, fv0
-mov.s      fv1, fa1
-lwc1       ft2, 0x10(sp)
-sub.s      fa1, ft1, fv1
-mul.s      fa0, fa0, fa0
-lwc1       ft3, 0x14(sp)
-sub.s      ft4, ft2, ft0
-mul.s      fa1, fa1, fa1
-li.s       AT, 0.5
-sub.s      ft5, ft3, ft1
-mul.s      ft4, ft4, ft4
-sub.s      fv0, fv0, ft2
-mul.s      ft5, ft5, ft5
-sub.s      fv1, fv1, ft3
-mul.s      fv0, fv0, fv0
-mtc1       AT, ft3
-add.s      fa0, fa0, fa1
-mul.s      fv1, fv1, fv1
-add.s      ft4, ft4, ft5
-sqrt.s     fa0, fa0
-sqrt.s     ft4, ft4
-add.s      fv0, fv0, fv1
-mtc1       zero, fv1
-add.s      ft5, fa0, ft4
-sqrt.s     fv0, fv0
-add.s      ft5, ft5, fv0
-mul.s      ft5, ft3, ft5
-sub.s      ft0, ft5, fa0
-sub.s      ft2, ft5, fv0
-mul.s      fv0, ft0, ft5
-sub.s      ft1, ft5, ft4
-mul.s      ft1, ft1, ft2
-NOP
-mul.s      fv0, fv0, ft1
-c.lt.s     fv0, fv1
-bc1fl      .L80070AD0
- NOP
-mov.s      fv0, fv1
-.L80070AD0:
-jr         ra
- sqrt.s    fv0, fv0
+    mtc1       a2, ft0
+    mov.s      fv0, fa0
+    mtc1       a3, ft1
+    sub.s      fa0, ft0, fv0
+    mov.s      fv1, fa1
+    lwc1       ft2, 0x10(sp)
+    sub.s      fa1, ft1, fv1
+    mul.s      fa0, fa0
+    lwc1       ft3, 0x14(sp)
+    sub.s      ft4, ft2, ft0
+    mul.s      fa1, fa1
+    sub.s      ft5, ft3, ft1
+    mul.s      ft4, ft4
+    sub.s      fv0, ft2
+    mul.s      ft5, ft5
+    sub.s      fv1, ft3
+    mul.s      fv0, fv0
+    li.s       ft3, 0.5
+    add.s      fa0, fa1
+    mul.s      fv1, fv1
+    add.s      ft4, ft5
+    sqrt.s     fa0
+    sqrt.s     ft4
+    add.s      fv0, fv1
+    mtc1       zero, fv1
+    add.s      ft5, fa0, ft4
+    sqrt.s     fv0
+    add.s      ft5, fv0
+    mul.s      ft5, ft3, ft5
+    sub.s      ft0, ft5, fa0
+    sub.s      ft2, ft5, fv0
+    mul.s      fv0, ft0, ft5
+    sub.s      ft1, ft5, ft4
+    mul.s      ft1, ft2
+    mul.s      fv0, ft1
+    c.lt.s     fv0, fv1
+    bc1fl      .L80070AD0
+    mov.s      fv0, fv1
+    .L80070AD0:
+    sqrt.s     fv0
+    jr         ra
 END(area_triangle_2d)
 
 LEAF(set_breakpoint)
-ori        a0, a0, 0x1
-MTC0(      a0, C0_WATCHLO)
-addiu      t0, zero, 0xF
-MTC0(      t0, C0_WATCHHI)
-NOP
-NOP
-NOP
-NOP
-NOP
-jr         ra
- NOP
+    ori        a0, a0, 0x1
+    MTC0(      a0, C0_WATCHLO)
+    addiu      t0, zero, 0xF
+    MTC0(      t0, C0_WATCHHI)
+    NOP
+    NOP
+    NOP
+    NOP
+    NOP
+    jr         ra
 END(set_breakpoint)
 
 LEAF(dmacopy_doubleword)
-ld         t0, 0x0(a0)
-ld         t1, 0x8(a0)
-addi       a2, a2, 0x10
-addi       a0, a0, 0x10
-sd         t0, -0x10(a2)
-bne        a2, a2, dmacopy_doubleword
- sd        t1, -0x8(a2)
-jr         ra
- NOP
+    ld         t0, 0x0(a0)
+    ld         t1, 0x8(a0)
+    addi       a1, 0x10
+    addi       a0, 0x10
+    sd         t0, -0x10(a1)
+    sd         t1, -0x8(a1)
+    bne        a1, a2, dmacopy_doubleword
+    jr         ra
 END(dmacopy_doubleword)

From 2b4f8fc731504bce26004443d17d39a387d29955 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 11:22:09 -0500
Subject: [PATCH 04/36] Do some cleanup and documenting

---
 src/hasm/ido/math_util.s | 302 ++++++++++++++++++++++++---------------
 1 file changed, 183 insertions(+), 119 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index f2b2f3088..e0d62c2d7 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -208,7 +208,7 @@ END(get_gIntDisFlag)
 
 LEAF(mtx_to_mtxs)
     ori        t0, zero, 4
-    lui        t7, 0xFFFF
+    lui        t7, 0xFFFF /* UNUSED */
     .L8006F584:
     lw         t1, 0x0(a0)
     lw         t2, 0x20(a0)
@@ -219,48 +219,53 @@ LEAF(mtx_to_mtxs)
     sh         t3, 0xC(a1)
     sh         t4, 0xE(a1)
     addiu      a0, a0, 0x8
-    srl        t1, t1, 16
-    srl        t2, t2, 16
-    srl        t3, t3, 16
-    srl        t4, t4, 16
+    srl        t1, 16
+    srl        t2, 16
+    srl        t3, 16
+    srl        t4, 16
     sh         t1, 0x0(a1)
     sh         t2, 0x2(a1)
     sh         t3, 0x8(a1)
     sh         t4, 0xA(a1)
-    addi       a1, a1, 0x10
+    addi       a1, 0x10
     addiu      t0, -1
     bnezl      t0, .L8006F584
     jr         ra
 END(mtx_to_mtxs)
 
 LEAF(mtxf_to_mtxs)
-    li.s       fa0, 65536.0
     ori        t0, zero, 4
+    li.s       fa0, 65536.0
     .L8006F5EC:
     lwc1       ft0, 0x0(a0)
     lwc1       ft1, 0x4(a0)
     lwc1       ft2, 0x8(a0)
-    mul.s      ft0, ft0, fa0
     lwc1       ft3, 0xC(a0)
-    addiu      a0, a0, 0x10
-    mul.s      ft1, ft1, fa0
-    addiu      t0, t0, -0x1
-    addiu      a1, a1, 0x10
-    mul.s      ft2, ft2, fa0
-    mul.s      ft3, ft3, fa0
+    mul.s      ft0, fa0
+    mul.s      ft1, fa0
+    mul.s      ft2, fa0
+    mul.s      ft3, fa0
     trunc.w.s  ft0, ft0
     trunc.w.s  ft1, ft1
-    swc1       ft0, -0x10(a1)
     trunc.w.s  ft2, ft2
-    swc1       ft1, -0xC(a1)
     trunc.w.s  ft3, ft3
-    swc1       ft2, -0x8(a1)
-    swc1       ft3, -0x4(a1)
+    swc1       ft0, 0x0(a1)
+    swc1       ft1, 0x4(a1)
+    swc1       ft2, 0x8(a1)
+    swc1       ft3, 0xC(a1)
+    addiu      a0, 0x10
+    addiu      t0, -1
+    addiu      a1, 0x10
     bnezl      t0, .L8006F5EC
     jr         ra
 END(mtxf_to_mtxs)
 
-/* Official Name: mathMtxXFMF */
+/**
+ * Transforms a 3D vector using a 4×4 transformation matrix.
+ * Perfect match to libultra compiled guMtxXFMF using -O3 -mips2
+ * Official name: mathMtxXFMF
+ * void mtxf_transform_point(float mf[4][4], float x, float y, float z, float *ox, float *oy, float *oz);
+ */
 LEAF(mtxf_transform_point)
     mtc1       a1, fa0
     mtc1       a2, fa1
@@ -275,7 +280,7 @@ LEAF(mtxf_transform_point)
     lwc1       ft3, 0x30(a0)
     add.s      ft1, ft5, ft2
     add.s      ft0, ft3, ft1
-    lw         t6,  0x10($sp)
+    lw         t6,  0x10(sp)
     swc1       ft0, 0x0(t6)
     lwc1       ft5, 0x4(a0)
     lwc1       ft3, 0x14(a0)
@@ -287,7 +292,7 @@ LEAF(mtxf_transform_point)
     lwc1       ft1, 0x34(a0)
     add.s      ft2, ft0, ft3
     add.s      ft5, ft1, ft2
-    lw         t7,  0x14($sp)
+    lw         t7,  0x14(sp)
     swc1       ft5, 0x0(t7)
     lwc1       ft0, 0x8(a0)
     lwc1       ft1, 0x18(a0)
@@ -299,7 +304,7 @@ LEAF(mtxf_transform_point)
     lwc1       ft2, 0x38(a0)
     add.s      ft3, ft5, ft1
     add.s      ft0, ft2, ft3
-    lw         t8,  0x18($sp)
+    lw         t8,  0x18(sp)
     swc1       ft0, 0x0(t8)
     jr         ra
 END(mtxf_transform_point)
@@ -340,109 +345,168 @@ LEAF(mtxf_transform_dir)
 END(mtxf_transform_dir)
 
 /* Official Name: mathMtxCatF */
+/* Multiplies two 4x4 floating-point matrices: result = m1 * m2 */
+/* Arguments:
+ *   a0 = pointer to first matrix (m1)
+ *   a1 = pointer to second matrix (m2)
+ *   a2 = pointer to result matrix
+ */
 LEAF(mtxf_mul)
     addiu      sp, sp, -8
-    sdc1       fv1, 0(sp)
-    ori        t0, zero, 4
-    .L80048F88:
-    lwc1       fv1, 0x0(a0)
-    lwc1       ft0, 0x4(a0)
-    lwc1       ft1, 0x8(a0)
-    lwc1       ft2, 0xC(a0)
-    lwc1       ft3, 0x0(a1)
-    lwc1       fa0, 0x10(a1)
-    lwc1       fa1, 0x20(a1)
-    lwc1       ft4, 0x30(a1)
-    mul.s      ft3, fv1, ft3
-    mul.s      fa0, ft0, fa0
-    mul.s      fa1, ft1, fa1
-    mul.s      ft4, ft2, ft4
-    add.s      fa1, fa0, fa1
-    add.s      ft4, ft3, ft4
-    lwc1       ft3, 0x4(a1)
-    mul.s      ft3, fv1, ft3
-    add.s      ft5, fa1, ft4
-    lwc1       fa0, 0x14(a1)
-    mul.s      fa0, ft0, fa0
-    lwc1       fa1, 0x24(a1)
-    mul.s      fa1, ft1, fa1
-    add.s      fa1, fa0, fa1
-    lwc1       ft4, 0x34(a1)
-    swc1       ft5, 0x0(a2)
-    lwc1       fa0, 0x18(a1)
-    mul.s      ft4, ft2, ft4
-    add.s      ft4, ft3, ft4
-    lwc1       ft3, 0x08(a1)
-    mul.s      ft3, fv1, ft3
-    add.s      ft5, fa1, ft4
-    mul.s      fa0, ft0, fa0
-    lwc1       fa1, 0x28(a1)
-    lwc1       ft4, 0x38(a1)
-    swc1       ft5, 0x4(a2)
-    mul.s      fa1, ft1, fa1
-    mul.s      ft4, ft2, ft4
-    add.s      fa1, fa0, fa1
-    add.s      ft4, ft3, ft4
-    lwc1       ft3, 0xC(a1)
-    lwc1       fa0, 0x1C(a1)
-    mul.s      ft3, fv1, ft3
-    add.s      ft5, fa1, ft4
-    mul.s      fa0, ft0, fa0
-    lwc1       fa1, 0x2C(a1)
-    lwc1       ft4, 0x3C(a1)
-    swc1       ft5, 0x8(a2)
-    mul.s      fa1, ft1, fa1
-    mul.s      ft4, ft2, ft4
-    add.s      fa1, fa0, fa1
-    add.s      ft4, ft3, ft4
-    add.s      ft5, fa1, ft4
-    swc1       ft5, 0xC(a2)
-    addiu      a0, 0x10
-    addiu      a2, 0x10
-    addiu      t0, -1
-    bnezl      t0, .L80048F88
-    ldc1       fv1, 0(sp)
+    sdc1       $f2, 0(sp)               /* Save $f2 register */
+    ori        t0, zero, 4              /* Loop counter for 4 rows */
+    
+.mtxf_mul_row_loop:
+    /* Load current row from first matrix (m1) */
+    lwc1       $f2, 0x0(a0)             /* m1[row][0] */
+    lwc1       $f4, 0x4(a0)             /* m1[row][1] */
+    lwc1       $f6, 0x8(a0)             /* m1[row][2] */
+    lwc1       $f8, 0xC(a0)             /* m1[row][3] */
+    
+    /* Load first column from second matrix (m2) */
+    lwc1       $f10, 0x0(a1)            /* m2[0][0] */
+    lwc1       $f12, 0x10(a1)           /* m2[1][0] */
+    lwc1       $f14, 0x20(a1)           /* m2[2][0] */
+    lwc1       $f16, 0x30(a1)           /* m2[3][0] */
+    
+    /* Calculate result[row][0] */
+    mul.s      $f10, $f2, $f10          /* m2[0][0] *= m1[row][0] */
+    mul.s      $f12, $f4, $f12          /* m2[1][0] *= m1[row][1] */
+    mul.s      $f14, $f6, $f14          /* m2[2][0] *= m1[row][2] */
+    mul.s      $f16, $f8, $f16          /* m2[3][0] *= m1[row][3] */
+    add.s      $f14, $f12, $f14         /* m2[2][0] += m2[1][0] */
+    add.s      $f16, $f10, $f16         /* m2[3][0] += m2[0][0] */
+    add.s      $f18, $f14, $f16         /* result[row][0] = m2[2][0] + m2[3][0] */
+    
+    /* Load second column from second matrix (m2) */
+    lwc1       $f10, 0x4(a1)            /* m2[0][1] */
+    lwc1       $f12, 0x14(a1)           /* m2[1][1] */
+    lwc1       $f14, 0x24(a1)           /* m2[2][1] */
+    lwc1       $f16, 0x34(a1)           /* m2[3][1] */
+
+    /* Store result[row][0] */
+    swc1       $f18, 0x0(a2)
+
+    /* Calculate result[row][1] */
+    mul.s      $f10, $f2, $f10          /* m2[0][1] *= m1[row][0] */
+    mul.s      $f12, $f4, $f12          /* m2[1][1] *= m1[row][1] */
+    mul.s      $f14, $f6, $f14          /* m2[2][1] *= m1[row][2] */
+    mul.s      $f16, $f8, $f16          /* m2[3][1] *= m1[row][3] */
+    add.s      $f14, $f12, $f14         /* m2[2][1] += m2[1][1] */
+    add.s      $f16, $f10, $f16         /* m2[3][1] += m2[0][1] */
+    add.s      $f18, $f14, $f16         /* result[row][1] = m2[2][1] + m2[3][1] */
+    
+    /* Load third column from second matrix (m2) */
+    lwc1       $f10, 0x08(a1)           /* m2[0][2] */
+    lwc1       $f12, 0x18(a1)           /* m2[1][2] */
+    lwc1       $f14, 0x28(a1)           /* m2[2][2] */
+    lwc1       $f16, 0x38(a1)           /* m2[3][2] */
+
+    /* Store result[row][1] */
+    swc1       $f18, 0x4(a2)
+
+    /* Calculate result[row][2] */
+    mul.s      $f10, $f2, $f10          /* m2[0][2] *= m1[row][0] */
+    mul.s      $f12, $f4, $f12          /* m2[1][2] *= m1[row][1] */
+    mul.s      $f14, $f6, $f14          /* m2[2][2] *= m1[row][2] */
+    mul.s      $f16, $f8, $f16          /* m2[3][2] *= m1[row][3] */
+    add.s      $f14, $f12, $f14         /* m2[2][2] += m2[1][2] */
+    add.s      $f16, $f10, $f16         /* m2[3][2] += m2[0][2] */
+    add.s      $f18, $f14, $f16         /* result[row][2] = m2[2][2] + m2[3][2] */
+
+    /* Load last column from second matrix (m2) */
+    lwc1       $f10, 0x0C(a1)           /* m2[0][3] */
+    lwc1       $f12, 0x1C(a1)           /* m2[1][3] */
+    lwc1       $f14, 0x2C(a1)           /* m2[2][3] */
+    lwc1       $f16, 0x3C(a1)           /* m2[3][3] */
+
+    /* Store result[row][2] */
+    swc1       $f18, 0x08(a2)
+    
+    /* Calculate result[row][3] */
+    mul.s      $f10, $f2, $f10          /* m2[0][3] *= m1[row][0] */
+    mul.s      $f12, $f4, $f12          /* m2[1][3] *= m1[row][1] */
+    mul.s      $f14, $f6, $f14          /* m2[2][3] *= m1[row][2] */
+    mul.s      $f16, $f8, $f16          /* m2[3][3] *= m1[row][3] */
+    add.s      $f14, $f12, $f14         /* m2[2][3] += m2[1][3] */
+    add.s      $f16, $f10, $f16         /* m2[3][3] += m2[0][3] */
+    add.s      $f18, $f14, $f16         /* result[row][3] = m2[2][3] + m2[3][3] */
+
+    /* Store result[row][3] */
+    swc1       $f18, 0xC(a2)
+    
+    /* Move to next row */
+    addiu      a0, 0x10                 /* Advance m1 pointer to next row */
+    addiu      a2, 0x10                 /* Advance result pointer to next row */
+    addiu      t0, -1                   /* Decrement loop counter */
+    bnezl      t0, .mtxf_mul_row_loop
+    
+    ldc1       $f2, 0(sp)               /* Restore $f2 register */
     addiu      sp, sp, 8
     jr         ra
 END(mtxf_mul)
 
 /* Official Name: mathMtxF2L */
+/* Converts a 4x4 floating-point matrix to fixed-point integer matrix */
+/* Arguments:
+ *   a0 = pointer to source floating-point matrix (MtxF)
+ *   a1 = pointer to destination fixed-point matrix (Mtx)
+ * The function converts float values to 16.16 fixed-point format
+ * and stores them in the N64s matrix format (split high/low words)
+ */
 LEAF(mtxf_to_mtx)
-    li.s       fa0, 65536.0
-    ori        t0, zero, 4 /* Loop counter */
-    .L80049090:
-    lwc1       ft0, 0x0(a0)
-    lwc1       ft1, 0x4(a0)
-    lwc1       ft2, 0x8(a0)
-    lwc1       ft3, 0xC(a0)
-    mul.s      ft0, ft0, fa0
-    mul.s      ft1, ft1, fa0
-    mul.s      ft2, ft2, fa0
-    mul.s      ft3, ft3, fa0
-    cvt.w.s    ft0, ft0
-    cvt.w.s    ft1, ft1
-    cvt.w.s    ft2, ft2
-    cvt.w.s    ft3, ft3
-    mfc1       t1, ft0
-    mfc1       t2, ft1
-    mfc1       t3, ft2
-    mfc1       t4, ft3
-    sh         t1, 0x20(a1)
-    sh         t2, 0x22(a1)
-    sh         t3, 0x24(a1)
-    sh         t4, 0x26(a1)
-    srl        t1, t1, 16
-    srl        t2, t2, 16
-    srl        t3, t3, 16
-    srl        t4, t4, 16
-    sh         t1, 0(a1)
-    sh         t2, 0x2(a1)
-    sh         t3, 0x4(a1)
-    sh         t4, 0x6(a1)
-    addiu      a0, 0x10 /* Increment MtxF pointer by 16 bytes */
-    addiu      a1, 0x8  /* Increment Mtx pointer by 8 bytes */
-    addiu      t0, -1   /* Decrement loop counter */
-    bnezl      t0, .L80049090
+    ori        t0, zero, 4             /* Loop counter for 4 rows */
+    li.s       fa0, 65536.0            /* Scaling factor to convert to 16.16 fixed-point */
+    
+.mtxf_to_mtx_row_loop:
+    /* Load 4 float values from current row */
+    lwc1       ft0, 0x0(a0)            /* Load element [row][0] */
+    lwc1       ft1, 0x4(a0)            /* Load element [row][1] */
+    lwc1       ft2, 0x8(a0)            /* Load element [row][2] */
+    lwc1       ft3, 0xC(a0)            /* Load element [row][3] */
+
+    /* Scale floats to fixed-point by multiplying by 65536.0 */
+    mul.s      ft0, fa0                /* Scale [row][0] */
+    mul.s      ft1, fa0                /* Scale [row][1] */
+    mul.s      ft2, fa0                /* Scale [row][2] */
+    mul.s      ft3, fa0                /* Scale [row][3] */
+
+    /* Convert scaled floats to 32-bit integers */
+    cvt.w.s    ft0                     /* Convert to word (integer) */
+    cvt.w.s    ft1
+    cvt.w.s    ft2
+    cvt.w.s    ft3
+
+    /* Move converted integers to general-purpose registers */
+    mfc1       t1, ft0                 /* Get integer value of [row][0] */
+    mfc1       t2, ft1                 /* Get integer value of [row][1] */
+    mfc1       t3, ft2                 /* Get integer value of [row][2] */
+    mfc1       t4, ft3                 /* Get integer value of [row][3] */
+    
+    /* Store fractional parts (low 16 bits) in second half of Mtx */
+    sh         t1, 0x20(a1)            /* Store low 16 bits of [row][0] */
+    sh         t2, 0x22(a1)            /* Store low 16 bits of [row][1] */
+    sh         t3, 0x24(a1)            /* Store low 16 bits of [row][2] */
+    sh         t4, 0x26(a1)            /* Store low 16 bits of [row][3] */
+    
+    /* Extract integer parts (high 16 bits) */
+    srl        t1, 16                  /* Shift right to get high 16 bits */
+    srl        t2, 16
+    srl        t3, 16
+    srl        t4, 16
+    
+    /* Store integer parts (high 16 bits) in first half of Mtx */
+    sh         t1, 0(a1)               /* Store high 16 bits of [row][0] */
+    sh         t2, 0x2(a1)             /* Store high 16 bits of [row][1] */
+    sh         t3, 0x4(a1)             /* Store high 16 bits of [row][2] */
+    sh         t4, 0x6(a1)             /* Store high 16 bits of [row][3] */
+    
+    /* Advance pointers to next row */
+    addiu      a0, 0x10                /* Advance MtxF pointer to next row (16 bytes) */
+    addiu      a1, 0x8                 /* Advance Mtx pointer by 8 bytes (interleaved format) */
+    addiu      t0, -1                  /* Decrement loop counter */
+    bnezl      t0, .mtxf_to_mtx_row_loop
+
     jr         ra
 END(mtxf_to_mtx)
 
@@ -465,7 +529,7 @@ LEAF(load_rng_seed)
 END(load_rng_seed)
 
 LEAF(get_rng_seed)
-    lw        v0, gCurrentRNGSeed
+    lw         v0, gCurrentRNGSeed
     jr         ra
 END(get_rng_seed)
 
@@ -1643,8 +1707,8 @@ END(set_breakpoint)
 LEAF(dmacopy_doubleword)
     ld         t0, 0x0(a0)
     ld         t1, 0x8(a0)
-    addi       a1, 0x10
     addi       a0, 0x10
+    addi       a1, 0x10
     sd         t0, -0x10(a1)
     sd         t1, -0x8(a1)
     bne        a1, a2, dmacopy_doubleword

From 297ae082a9cf90a4adb747c69a191e425fcd4517 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 11:32:10 -0500
Subject: [PATCH 05/36] slightly better comments now

---
 src/hasm/ido/math_util.s | 56 ++++++++++++++++++++--------------------
 1 file changed, 28 insertions(+), 28 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index e0d62c2d7..5293e891b 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -370,13 +370,13 @@ LEAF(mtxf_mul)
     lwc1       $f16, 0x30(a1)           /* m2[3][0] */
     
     /* Calculate result[row][0] */
-    mul.s      $f10, $f2, $f10          /* m2[0][0] *= m1[row][0] */
-    mul.s      $f12, $f4, $f12          /* m2[1][0] *= m1[row][1] */
-    mul.s      $f14, $f6, $f14          /* m2[2][0] *= m1[row][2] */
-    mul.s      $f16, $f8, $f16          /* m2[3][0] *= m1[row][3] */
-    add.s      $f14, $f12, $f14         /* m2[2][0] += m2[1][0] */
-    add.s      $f16, $f10, $f16         /* m2[3][0] += m2[0][0] */
-    add.s      $f18, $f14, $f16         /* result[row][0] = m2[2][0] + m2[3][0] */
+    mul.s      $f10, $f2, $f10          /* temp0 = m1[row][0] * m2[0][0] */
+    mul.s      $f12, $f4, $f12          /* temp1 = m1[row][1] * m2[1][0] */
+    mul.s      $f14, $f6, $f14          /* temp2 = m1[row][2] * m2[2][0] */
+    mul.s      $f16, $f8, $f16          /* temp3 = m1[row][3] * m2[3][0] */
+    add.s      $f14, $f12, $f14         /* temp2 = temp1 + temp2 */
+    add.s      $f16, $f10, $f16         /* temp3 = temp0 + temp3 */
+    add.s      $f18, $f14, $f16         /* result[row][0] = temp2 + temp3 */
     
     /* Load second column from second matrix (m2) */
     lwc1       $f10, 0x4(a1)            /* m2[0][1] */
@@ -388,13 +388,13 @@ LEAF(mtxf_mul)
     swc1       $f18, 0x0(a2)
 
     /* Calculate result[row][1] */
-    mul.s      $f10, $f2, $f10          /* m2[0][1] *= m1[row][0] */
-    mul.s      $f12, $f4, $f12          /* m2[1][1] *= m1[row][1] */
-    mul.s      $f14, $f6, $f14          /* m2[2][1] *= m1[row][2] */
-    mul.s      $f16, $f8, $f16          /* m2[3][1] *= m1[row][3] */
-    add.s      $f14, $f12, $f14         /* m2[2][1] += m2[1][1] */
-    add.s      $f16, $f10, $f16         /* m2[3][1] += m2[0][1] */
-    add.s      $f18, $f14, $f16         /* result[row][1] = m2[2][1] + m2[3][1] */
+    mul.s      $f10, $f2, $f10          /* temp0 = m1[row][0] * m2[0][1] */
+    mul.s      $f12, $f4, $f12          /* temp1 = m1[row][1] * m2[1][1] */
+    mul.s      $f14, $f6, $f14          /* temp2 = m1[row][2] * m2[2][1] */
+    mul.s      $f16, $f8, $f16          /* temp3 = m1[row][3] * m2[3][1] */
+    add.s      $f14, $f12, $f14         /* temp2 = temp1 + temp2 */
+    add.s      $f16, $f10, $f16         /* temp3 = temp0 + temp3 */
+    add.s      $f18, $f14, $f16         /* result[row][1] = temp2 + temp3 */
     
     /* Load third column from second matrix (m2) */
     lwc1       $f10, 0x08(a1)           /* m2[0][2] */
@@ -406,13 +406,13 @@ LEAF(mtxf_mul)
     swc1       $f18, 0x4(a2)
 
     /* Calculate result[row][2] */
-    mul.s      $f10, $f2, $f10          /* m2[0][2] *= m1[row][0] */
-    mul.s      $f12, $f4, $f12          /* m2[1][2] *= m1[row][1] */
-    mul.s      $f14, $f6, $f14          /* m2[2][2] *= m1[row][2] */
-    mul.s      $f16, $f8, $f16          /* m2[3][2] *= m1[row][3] */
-    add.s      $f14, $f12, $f14         /* m2[2][2] += m2[1][2] */
-    add.s      $f16, $f10, $f16         /* m2[3][2] += m2[0][2] */
-    add.s      $f18, $f14, $f16         /* result[row][2] = m2[2][2] + m2[3][2] */
+    mul.s      $f10, $f2, $f10          /* temp0 = m1[row][0] * m2[0][2] */
+    mul.s      $f12, $f4, $f12          /* temp1 = m1[row][1] * m2[1][2] */
+    mul.s      $f14, $f6, $f14          /* temp2 = m1[row][2] * m2[2][2] */
+    mul.s      $f16, $f8, $f16          /* temp3 = m1[row][3] * m2[3][2] */
+    add.s      $f14, $f12, $f14         /* temp2 = temp1 + temp2 */
+    add.s      $f16, $f10, $f16         /* temp3 = temp0 + temp3 */
+    add.s      $f18, $f14, $f16         /* result[row][2] = temp2 + temp3 */
 
     /* Load last column from second matrix (m2) */
     lwc1       $f10, 0x0C(a1)           /* m2[0][3] */
@@ -424,13 +424,13 @@ LEAF(mtxf_mul)
     swc1       $f18, 0x08(a2)
     
     /* Calculate result[row][3] */
-    mul.s      $f10, $f2, $f10          /* m2[0][3] *= m1[row][0] */
-    mul.s      $f12, $f4, $f12          /* m2[1][3] *= m1[row][1] */
-    mul.s      $f14, $f6, $f14          /* m2[2][3] *= m1[row][2] */
-    mul.s      $f16, $f8, $f16          /* m2[3][3] *= m1[row][3] */
-    add.s      $f14, $f12, $f14         /* m2[2][3] += m2[1][3] */
-    add.s      $f16, $f10, $f16         /* m2[3][3] += m2[0][3] */
-    add.s      $f18, $f14, $f16         /* result[row][3] = m2[2][3] + m2[3][3] */
+    mul.s      $f10, $f2, $f10          /* temp0 = m1[row][0] * m2[0][3] */
+    mul.s      $f12, $f4, $f12          /* temp1 = m1[row][1] * m2[1][3] */
+    mul.s      $f14, $f6, $f14          /* temp2 = m1[row][2] * m2[2][3] */
+    mul.s      $f16, $f8, $f16          /* temp3 = m1[row][3] * m2[3][3] */
+    add.s      $f14, $f12, $f14         /* temp2 = temp1 + temp2 */
+    add.s      $f16, $f10, $f16         /* temp3 = temp0 + temp3 */
+    add.s      $f18, $f14, $f16         /* result[row][3] = temp2 + temp3 */
 
     /* Store result[row][3] */
     swc1       $f18, 0xC(a2)

From f4a5e3ec8769cf015896779662d2df89d96cca0e Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 12:02:15 -0500
Subject: [PATCH 06/36] Document mtxf_transform_dir

---
 src/hasm/ido/math_util.s | 78 ++++++++++++++++++++++++++++------------
 1 file changed, 56 insertions(+), 22 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 5293e891b..51246bb67 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -309,38 +309,72 @@ LEAF(mtxf_transform_point)
     jr         ra
 END(mtxf_transform_point)
 
-/* Official Name: mathMtxFastXFMF */
+
+/**
+ * Transforms a direction vector in 3D space using the rotation part of a 4×4 matrix.
+ * This function multiplies the input vector by the upper-left 3×3 portion of the matrix mf,
+ * ignoring the translation component. It is used for transforming directions, such as normals,
+ * rather than points.
+ * Official Name: mathMtxFastXFMF
+ * Arguments:
+ *   a0 = pointer to 4x4 matrix (float[4][4])
+ *   a1 = pointer to input direction vector (float[3])
+ *   a2 = pointer to output direction vector (float[3])
+ */
 LEAF(mtxf_transform_dir)
-    lwc1       ft0, 0x0(a1)
-    lwc1       ft1, 0x4(a1)
-    lwc1       ft3, 0x0(a0)
-    lwc1       fa0, 0x10(a0)
-    mul.s      ft3, ft0, ft3
-    lwc1       ft2, 0x8(a1)
-    lwc1       fa1, 0x20(a0)
-    mul.s      fa0, ft1, fa0
+    /* Load input vector components */
+    lwc1       ft0, 0x0(a1)     /* x component */
+    lwc1       ft1, 0x4(a1)     /* y component */
+    lwc1       ft2, 0x8(a1)     /* z component */
+
+    /* Load first column from matrix */
+    lwc1       ft3, 0x0(a0)     /* mf[0][0] */
+    lwc1       fa0, 0x10(a0)    /* mf[1][0] */
+    lwc1       fa1, 0x20(a0)    /* mf[2][0] */
+
+    /* Calculate result.x */
+    mul.s      ft3, ft0, ft3    /* mf[0][0] * x */
+    mul.s      fa0, ft1, fa0    /* mf[1][0] * y */
+    mul.s      fa1, ft2, fa1    /* mf[2][0] * z */
+
     add.s      fa0, ft3, fa0
-    mul.s      fa1, ft2, fa1
-    lwc1       ft3, 0x4(a0)
-    mul.s      ft3, ft0, ft3
     add.s      ft4, fa0, fa1
-    lwc1       fa0, 0x14(a0)
-    lwc1       fa1, 0x24(a0)
-    mul.s      fa0, ft1, fa0
+    
+    /* Load second column from matrix */
+    lwc1       ft3, 0x4(a0)     /* mf[0][1] */
+    lwc1       fa0, 0x14(a0)    /* mf[1][1] */
+    lwc1       fa1, 0x24(a0)    /* mf[2][1] */
+
+    /* Store result.x */
     swc1       ft4, 0x0(a2)
-    mul.s      fa1, ft2, fa1
+
+    /* Calculate result.y */
+    mul.s      ft3, ft0, ft3    /* mf[0][1] * x */
+    mul.s      fa0, ft1, fa0    /* mf[1][1] * y */
+    mul.s      fa1, ft2, fa1    /* mf[2][1] * z */
+
     add.s      fa0, ft3, fa0
-    lwc1       ft3, 0x8(a0)
     add.s      ft4, fa0, fa1
-    mul.s      ft3, ft0, ft3
-    lwc1       fa0, 0x18(a0)
-    lwc1       fa1, 0x28(a0)
+
+    /* Load third column from matrix */
+    lwc1       ft3, 0x8(a0)     /* mf[0][2] */
+    lwc1       fa0, 0x18(a0)    /* mf[1][2] */
+    lwc1       fa1, 0x28(a0)    /* mf[2][2] */
+
+    /* Store result.y */
     swc1       ft4, 0x4(a2)
-    mul.s      fa0, ft1, fa0
+
+    /* Calculate result.z */
+    mul.s      ft3, ft0, ft3    /* mf[0][2] * x */
+    mul.s      fa0, ft1, fa0    /* mf[1][2] * y */
+    mul.s      fa1, ft2, fa1    /* mf[2][2] * z */
+
     add.s      fa0, ft3, fa0
-    mul.s      fa1, ft2, fa1
     add.s      fa1, fa0, fa1
+
+    /* Store result.z */
     swc1       fa1, 0x8(a2)
+    
     jr         ra
 END(mtxf_transform_dir)
 

From 05e8b29f176a83cc8392d631e541eec7840dac05 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 13:42:16 -0500
Subject: [PATCH 07/36] 2 more hasm docs

---
 src/hasm/ido/math_util.s | 126 ++++++++++++++++++++++++++-------------
 1 file changed, 86 insertions(+), 40 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 51246bb67..e9ad72a5e 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -206,57 +206,103 @@ LEAF(get_gIntDisFlag)
     jr         ra
 END(get_gIntDisFlag)
 
+/**
+ * Converts a Mtx (fixed-point matrix with split integer and fractional parts)
+ * into a 4×4 matrix of 32-bit signed integers, where each element is in 16.16 fixed-point format.
+ *
+ * Arguments:
+ *   a0 = pointer to source fixed-point matrix (Mtx) in N64 format
+ *   a1 = pointer to destination short matrix (Mtxs)
+ * The N64 Mtx format stores matrices as:
+ *   - First 32 bytes: integer parts (high 16 bits)
+ *   - Second 32 bytes: fractional parts (low 16 bits)
+ * This function extracts and recombines them into standard 16-bit shorts
+ */
 LEAF(mtx_to_mtxs)
-    ori        t0, zero, 4
-    lui        t7, 0xFFFF /* UNUSED */
-    .L8006F584:
-    lw         t1, 0x0(a0)
-    lw         t2, 0x20(a0)
-    lw         t3, 0x4(a0)
-    lw         t4, 0x24(a0)
-    sh         t1, 0x4(a1)
-    sh         t2, 0x6(a1)
-    sh         t3, 0xC(a1)
-    sh         t4, 0xE(a1)
-    addiu      a0, a0, 0x8
-    srl        t1, 16
-    srl        t2, 16
-    srl        t3, 16
-    srl        t4, 16
-    sh         t1, 0x0(a1)
-    sh         t2, 0x2(a1)
-    sh         t3, 0x8(a1)
-    sh         t4, 0xA(a1)
+    ori        t0, zero, 4              /* Loop counter for 4 rows */
+    lui        t7, 0xFFFF               /* UNUSED - likely debug/optimization artifact */
+
+.mtx_to_mtxs_row_loop:
+    /* Load pairs of matrix elements (integer and fractional parts) */
+    lw         t1, 0x0(a0)              /* Load elements [row][0] and [row][1] integer parts */
+    lw         t2, 0x20(a0)             /* Load elements [row][0] and [row][1] fractional parts */
+    lw         t3, 0x4(a0)              /* Load elements [row][2] and [row][3] integer parts */
+    lw         t4, 0x24(a0)             /* Load elements [row][2] and [row][3] fractional parts */
+
+    /* Store fractional parts (low 16 bits) first */
+    sh         t1, 0x4(a1)              /* Store fractional part of [row][0] */
+    sh         t2, 0x6(a1)              /* Store fractional part of [row][1] */
+    sh         t3, 0xC(a1)              /* Store fractional part of [row][2] */
+    sh         t4, 0xE(a1)              /* Store fractional part of [row][3] */
+
+    /* Advance source pointer to next pair of elements */
+    addiu      a0, 0x8
+
+    /* Extract integer parts (high 16 bits) by shifting right */
+    srl        t1, 16                   /* Get integer part of [row][0] */
+    srl        t2, 16                   /* Get integer part of [row][1] */
+    srl        t3, 16                   /* Get integer part of [row][2] */
+    srl        t4, 16                   /* Get integer part of [row][3] */
+
+    /* Store integer parts (high 16 bits) */
+    sh         t1, 0x0(a1)              /* Store integer part of [row][0] */
+    sh         t2, 0x2(a1)              /* Store integer part of [row][1] */
+    sh         t3, 0x8(a1)              /* Store integer part of [row][2] */
+    sh         t4, 0xA(a1)              /* Store integer part of [row][3] */
+
+    /* Advance destination pointer to next row (16 bytes = 8 shorts) */
     addi       a1, 0x10
+
+    /* Decrement loop counter and continue if not done */
     addiu      t0, -1
-    bnezl      t0, .L8006F584
+    bnezl      t0, .mtx_to_mtxs_row_loop
+
     jr         ra
 END(mtx_to_mtxs)
 
+/**
+ * Converts a 4×4 matrix of 32-bit floating-point values into a 4×4 matrix
+ * of 32-bit signed fixed-point values in 16.16 format.
+ *
+ * Arguments:
+ *   a0 = pointer to source floating-point matrix (MtxF)
+ *   a1 = pointer to destination 32-bit integer matrix (Mtxs)
+ */
 LEAF(mtxf_to_mtxs)
-    ori        t0, zero, 4
-    li.s       fa0, 65536.0
-    .L8006F5EC:
-    lwc1       ft0, 0x0(a0)
-    lwc1       ft1, 0x4(a0)
-    lwc1       ft2, 0x8(a0)
-    lwc1       ft3, 0xC(a0)
-    mul.s      ft0, fa0
-    mul.s      ft1, fa0
-    mul.s      ft2, fa0
-    mul.s      ft3, fa0
+    ori        t0, zero, 4              /* Loop counter for 4 rows */
+    li.s       fa0, 65536.0             /* Scaling factor to convert to 16.16 fixed-point */
+    
+.mtxf_to_mtxs_row_loop:
+    /* Load 4 float values from current row */
+    lwc1       ft0, 0x0(a0)             /* Load element [row][0] */
+    lwc1       ft1, 0x4(a0)             /* Load element [row][1] */
+    lwc1       ft2, 0x8(a0)             /* Load element [row][2] */
+    lwc1       ft3, 0xC(a0)             /* Load element [row][3] */
+    
+    /* Scale floats to fixed-point (FTOFIX32) */
+    mul.s      ft0, fa0                 /* Scale [row][0] */
+    mul.s      ft1, fa0                 /* Scale [row][1] */
+    mul.s      ft2, fa0                 /* Scale [row][2] */
+    mul.s      ft3, fa0                 /* Scale [row][3] */
+    
+    /* Convert scaled floats to 32-bit integers (truncate towards zero) */
     trunc.w.s  ft0, ft0
     trunc.w.s  ft1, ft1
     trunc.w.s  ft2, ft2
     trunc.w.s  ft3, ft3
-    swc1       ft0, 0x0(a1)
-    swc1       ft1, 0x4(a1)
-    swc1       ft2, 0x8(a1)
-    swc1       ft3, 0xC(a1)
-    addiu      a0, 0x10
-    addiu      t0, -1
-    addiu      a1, 0x10
-    bnezl      t0, .L8006F5EC
+    
+    /* Store converted integers directly to destination */
+    swc1       ft0, 0x0(a1)             /* Store [row][0] as 32-bit int */
+    swc1       ft1, 0x4(a1)             /* Store [row][1] as 32-bit int */
+    swc1       ft2, 0x8(a1)             /* Store [row][2] as 32-bit int */
+    swc1       ft3, 0xC(a1)             /* Store [row][3] as 32-bit int */
+    
+    /* Advance pointers to next row */
+    addiu      a0, 0x10                 /* Advance source pointer to next row (16 bytes) */
+    addiu      t0, -1                   /* Decrement loop counter */
+    addiu      a1, 0x10                 /* Advance destination pointer to next row (16 bytes) */
+    bnezl      t0, .mtxf_to_mtxs_row_loop
+    
     jr         ra
 END(mtxf_to_mtxs)
 

From 420c70ddc0be426a863599b89056dcef0c441711 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 15:20:52 -0500
Subject: [PATCH 08/36] vec3s_reflect

---
 src/hasm/ido/math_util.s | 125 ++++++++++++++++++++++++++-------------
 1 file changed, 83 insertions(+), 42 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index e9ad72a5e..d1cab945a 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -424,9 +424,9 @@ LEAF(mtxf_transform_dir)
     jr         ra
 END(mtxf_transform_dir)
 
-/* Official Name: mathMtxCatF */
-/* Multiplies two 4x4 floating-point matrices: result = m1 * m2 */
-/* Arguments:
+/* Official Name: mathMtxCatF
+ * Multiplies two 4x4 floating-point matrices: result = m1 * m2
+ * Arguments:
  *   a0 = pointer to first matrix (m1)
  *   a1 = pointer to second matrix (m2)
  *   a2 = pointer to result matrix
@@ -526,9 +526,9 @@ LEAF(mtxf_mul)
     jr         ra
 END(mtxf_mul)
 
-/* Official Name: mathMtxF2L */
-/* Converts a 4x4 floating-point matrix to fixed-point integer matrix */
-/* Arguments:
+/* Official Name: mathMtxF2L
+ * Converts a 4x4 floating-point matrix to fixed-point integer matrix
+ * Arguments:
  *   a0 = pointer to source floating-point matrix (MtxF)
  *   a1 = pointer to destination fixed-point matrix (Mtx)
  * The function converts float values to 16.16 fixed-point format
@@ -590,39 +590,50 @@ LEAF(mtxf_to_mtx)
     jr         ra
 END(mtxf_to_mtx)
 
-/* Official Name: mathSeed */
+/* 
+ * gCurrentRNGSeed = num
+ * Official Name: mathSeed
+ */
 LEAF(set_rng_seed)
     sw         a0, gCurrentRNGSeed
     jr         ra
 END(set_rng_seed)
 
+/* gPrevRNGSeed = gCurrentRNGSeed */
 LEAF(save_rng_seed)
     lw         a0, gCurrentRNGSeed
     sw         a0, gPrevRNGSeed
     jr         ra
 END(save_rng_seed)
 
+/* gCurrentRNGSeed = gPrevRNGSeed */
 LEAF(load_rng_seed)
     lw         a0, gPrevRNGSeed
     sw         a0, gCurrentRNGSeed
     jr         ra
 END(load_rng_seed)
 
+/* return gCurrentRNGSeed */
 LEAF(get_rng_seed)
     lw         v0, gCurrentRNGSeed
     jr         ra
 END(get_rng_seed)
 
-/* Official Name: mathRnd */
+/* Official Name: mathRnd
+ * Generates a random integer within the inclusive range [min, max].
+ * Arguments:
+ *   a0 = min
+ *   a1 = max
+ */
 LEAF(rand_range)
     lw         t0, gCurrentRNGSeed
     sub        a1, a0
     dsll32     t1, t0, 31
-    dsll       t2, t0, 31
     dsrl       t1, 31
+    dsll       t2, t0, 31
     dsrl32     t2, 0
-    dsll32     t3, t0, 12
     or         t1, t2
+    dsll32     t3, t0, 12
     dsrl32     t3, 0
     xor        t1, t3
     dsrl       t3, t1, 20
@@ -637,39 +648,69 @@ LEAF(rand_range)
     jr         ra
 END(rand_range)
 
-/* Official Name: fastShortReflection */
-/* Does t6 even do anything? */
+/* Official Name: fastShortReflection
+ * Reflects a vector across a given normal.
+ * Fixed-point notes:
+ *   - Inputs are 16-bit signed fixed-point values.
+ *   - Dot product is accumulated in 32-bit, then shifted right by 12 to rescale.
+ *   - Multiplication by N components is then shifted right by 13, giving final scale.
+ * Arguments:
+ *   a0 = pointer to vector struct containing:
+ *        - input incident vector [x, y, z] at offsets 0x0, 0x2, 0x4
+ *        - output reflected vector will be stored at offsets 0x6, 0x8, 0xA
+ *   a1 = pointer to surface normal vector [nx, ny, nz] at offsets 0x0, 0x2, 0x4
+ */
 LEAF(vec3s_reflect)
-    lh         t0, 0x0(a0)
-    lh         t1, 0x2(a0)
-    lh         t2, 0x4(a0)
-    lh         t3, 0x0(a1)
-    lh         t4, 0x2(a1)
-    lh         t5, 0x4(a1)
-    mult       t0, t3
-    mflo       t6
-    mult       t1, t4
-    mflo       t7
-    add        t6, t7
-    mult       t2, t5
-    mflo       t8
-    add        t6, t8
-    sra        t6, 12
-    mult       t6, t3
-    mflo       t3
-    sra        t3, 13
-    sub        t3, t0
-    sh         t3, 0x6(a0)
-    mult       t6, t4
-    mflo       t4
-    sra        t4, 13
-    sub        t4, t1
-    mult       t6, t5
-    sh         t4, 0x8(a0)
-    mflo       t5
-    sra        t5, 13
-    sub        t5, t0
-    sh         t5, 0xA(a0)
+    /* Load incident vector components (16-bit signed) */
+    lh         t0, 0x0(a0)              /* incident.x */
+    lh         t1, 0x2(a0)              /* incident.y */
+    lh         t2, 0x4(a0)              /* incident.z */
+    
+    /* Load normal vector components (16-bit signed) */
+    lh         t3, 0x0(a1)              /* normal.x */
+    lh         t4, 0x2(a1)              /* normal.y */
+    lh         t5, 0x4(a1)              /* normal.z */
+    
+    /* Calculate dot product: dot = (incident.x * normal.x) + (incident.y * normal.y) + (incident.z * normal.z) */
+    mult       t0, t3                   /* incident.x * normal.x */
+    mflo       t6                       /* dot = result */
+    
+    mult       t1, t4                   /* incident.y * normal.y */
+    mflo       t7                       /* temp = result */
+    add        t6, t7                   /* dot += temp */
+    
+    mult       t2, t5                   /* incident.z * normal.z */
+    mflo       t8                       /* temp = result */
+    add        t6, t8                   /* dot += temp */
+    
+    /* Scale down accumulated dot product (fixed-point normalization) */
+    sra        t6, 12                   /* dot >>= 12 */
+    
+    /* Calculate reflected.x = (dot * normal.x >> 13) - incident.x */
+    mult       t6, t3                   /* (dot * normal.x) */
+    mflo       t3                       /* scaled_normal_x = result */
+    sra        t3, 13                   /* scaled_normal_x >>= 13 */
+    sub        t3, t3, t0               /* reflected.x = scaled_normal_x - incident.x */
+    sh         t3, 0x6(a0)              /* Store reflected.x */
+    
+    /* Calculate reflected.y = (dot * normal.y >> 13) - incident.y */
+    mult       t6, t4                   /* (dot * normal.y) */
+    mflo       t4                       /* scaled_normal_y = result */
+    sra        t4, 13                   /* scaled_normal_y >>= 13 */
+    sub        t4, t4, t1               /* reflected.y = scaled_normal_y - incident.y */
+    sh         t4, 0x8(a0)              /* Store reflected.y */
+    
+    /* Calculate reflected.z = (dot * normal.z >> 13) - incident.z */
+    mult       t6, t5                   /* (dot * normal.z) */
+    mflo       t5                       /* scaled_normal_z = result */
+    sra        t5, 13                   /* scaled_normal_z >>= 13 */
+#ifdef AVOID_UB
+    sub        t5, t5, t2               /* reflected.z = scaled_normal_z - incident.z */
+#else
+    sub        t5, t5, t0               /* !@bug: should subtract incident.z (t2), not incident.x (t0) */
+#endif
+    sh         t5, 0xA(a0)              /* Store reflected.z */
+    
     jr         ra
 END(vec3s_reflect)
 

From 2e709c16eb273f9c8bcedcc804e02c34107e9966 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 15:29:06 -0500
Subject: [PATCH 09/36] mtx_to_mtxs_2

---
 src/hasm/ido/math_util.s | 47 ++++++++++++++++++++++++++++++----------
 1 file changed, 35 insertions(+), 12 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index d1cab945a..401050cf5 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -714,19 +714,42 @@ LEAF(vec3s_reflect)
     jr         ra
 END(vec3s_reflect)
 
+/**
+ * Converts an N64 microcode matrix (Mtx) into a contiguous 4×4 matrix of
+ * 32-bit signed integers in 16.16 fixed-point format.
+ *
+ * Source (a0): pointer to Mtx laid out as:
+ *   - High 16 bits (integer parts)  at offset 0x00 (16-bit shorts, 16 entries)
+ *   - Low 16 bits  (fractional parts) at offset 0x20 (16-bit shorts, 16 entries)
+ *
+ * Destination (a1): pointer to an array of 16 32-bit words laid out as:
+ *   - For each element i in [0, 15]:
+ *       dest[i] = (high[i] << 16) | (low[i] & 0xFFFF)
+ */
 LEAF(mtx_to_mtxs_2)
-    ori        t2, zero, 0x10
-    xor        t3, t3
-    .L8006FA48:
-    lh         t0, 0x0(a0)
-    lhu        t1, 0x20(a0)
-    addi       a0, 0x2
-    sll        t0, 16
-    or         t0, t1
-    sw         t0, 0x0(a1)
-    addi       a1, 0x4
-    addiu      t3, 0x1
-    bnel       t3, t2, .L8006FA48
+    ori        t2, zero, 16             /* t2 = 16, number of matrix elements to convert */
+    xor        t3, t3                   /* t3 = element index (0..15) */
+
+.mtx_to_mtxs_2_element_loop:
+    /* Load one elements integer and fractional parts from Mtx layout */
+    lh         t0, 0x0(a0)              /* t0 = high 16 bits (integer part) from upper half */
+    lhu        t1, 0x20(a0)             /* t1 = low 16 bits (fractional part) from lower half */
+
+    /* Advance source pointer to next element (both high and low halves use same index) */
+    addi       a0, 0x2                  /* move to next short in both the 0x0 and 0x20 regions */
+
+    /* Pack into 16.16 fixed-point 32-bit value */
+    sll        t0, 16                   /* shift integer part into upper 16 bits */
+    or         t0, t1                   /* combine with fractional low 16 bits */
+
+    /* Store packed 32-bit fixed-point value */
+    sw         t0, 0x0(a1)              /* dest[element] = (high << 16) | low */
+    addi       a1, 0x4                  /* advance destination to next word */
+
+    /* Increment element counter and loop until 16 elements done */
+    addiu      t3, 1                    /* t3++ */
+    bnel       t3, t2, .mtx_to_mtxs_2_element_loop
+
     jr         ra
 END(mtx_to_mtxs_2)
 

From ffc85883dd8651b79ca1b58644053f0dbeea9538 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 20:52:50 -0500
Subject: [PATCH 10/36] Document mtxs_transform_point

---
 src/hasm/ido/math_util.s | 24 ++++++++++++------------
 1 file changed, 12 insertions(+), 12 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 401050cf5..0ca00e4de 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -759,45 +759,45 @@ LEAF(mtxs_transform_point)
     lh         t2, 0x4(a1)
     lw         t3, 0x0(a0)
     mult       t0, t3
-    lw         t3, 0x10(a0)
     mflo       t4
+    lw         t3, 0x10(a0)
     mult       t1, t3
-    lw         t3, 0x20(a0)
     mflo       t5
+    lw         t3, 0x20(a0)
     mult       t2, t3
-    add        t4, t5
-    lw         t3, 0x30(a0)
     mflo       t6
+    lw         t3, 0x30(a0)
+    add        t4, t5
     add        t4, t6
     add        t4, t3
     sra        t4, 16
     sh         t4, 0x0(a1)
     lw         t3, 0x4(a0)
     mult       t0, t3
-    lw         t3, 0x14(a0)
     mflo       t4
+    lw         t3, 0x14(a0)
     mult       t1, t3
-    lw         t3, 0x24(a0)
     mflo       t5
-    add        t4, t5
+    lw         t3, 0x24(a0)
     mult       t2, t3
-    lw         t3, 0x34(a0)
     mflo       t6
+    lw         t3, 0x34(a0)
+    add        t4, t5
     add        t4, t6
     add        t4, t3
     sra        t4, 16
     sh         t4, 0x2(a1)
     lw         t3, 0x8(a0)
     mult       t0, t3
-    lw         t3, 0x18(a0)
     mflo       t4
+    lw         t3, 0x18(a0)
     mult       t1, t3
-    lw         t3, 0x28(a0)
     mflo       t5
-    add        t4, t5
+    lw         t3, 0x28(a0)
     mult       t2, t3
-    lw         t3, 0x38(a0)
     mflo       t6
+    lw         t3, 0x38(a0)
+    add        t4, t5
     add        t4, t6
     add        t4, t3
     sra        t4, 16

From 1cb7ca56b2d01d27e43a6e694e685452f528630c Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 21:15:21 -0500
Subject: [PATCH 11/36] mtxs_transform_point and mtxs_transform_dir

---
 Makefile                  |   1 +
 src/hasm/ido/asm_macros.h |   7 ++
 src/hasm/ido/math_util.s  | 207 +++++++++++++++++++++++++-------------
 3 files changed, 144 insertions(+), 71 deletions(-)
 create mode 100644 src/hasm/ido/asm_macros.h

diff --git a/Makefile b/Makefile
index 2a6b3a4cd..738e23702 100755
--- a/Makefile
+++ b/Makefile
@@ -188,6 +188,7 @@ C_DEFINES += -DCIC_ID=$(BOOT_CIC)
 INCLUDE_CFLAGS  = -I . -I include -I include/libc  -I include/PR -I include/sys -I $(BIN_DIRS) -I $(SRC_DIR) -I $(LIBULTRA_DIR)
 INCLUDE_CFLAGS += -I $(LIBULTRA_DIR)/src/gu -I $(LIBULTRA_DIR)/src/libc -I $(LIBULTRA_DIR)/src/io  -I $(LIBULTRA_DIR)/src/sc
 INCLUDE_CFLAGS += -I $(LIBULTRA_DIR)/src/audio -I $(LIBULTRA_DIR)/src/os
+INCLUDE_CFLAGS += -I $(SRC_DIR)/hasm -I $(SRC_DIR)/hasm/ido
 
 ASFLAGS        = -march=vr4300 -32 -G0 $(ASM_DEFINES) $(INCLUDE_CFLAGS)
 OBJCOPYFLAGS   = -O binary
diff --git a/src/hasm/ido/asm_macros.h b/src/hasm/ido/asm_macros.h
new file mode 100644
index 000000000..2022ba428
--- /dev/null
+++ b/src/hasm/ido/asm_macros.h
@@ -0,0 +1,7 @@
+/* 
+    Define a macro for signed multiplication of two registers, storing the result in a destination register
+    This is similar to the MUL instruction but is mult instead of multu.
+*/
+#define MULS(rd, rs, rt) \
+    mult   rs, rt; \
+    mflo   rd
\ No newline at end of file
diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 0ca00e4de..e3a672547 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -5,6 +5,7 @@
 #include "PR/R4300.h"
 #include "sys/asm.h"
 #include "sys/regdef.h"
+#include "asm_macros.h"
 
 .data
 
@@ -753,104 +754,168 @@ LEAF(mtx_to_mtxs_2)
     jr         ra
 END(mtx_to_mtxs_2)
 
+/**
+ * Transforms a 3D point using a 4×4 matrix in 16.16 fixed-point format.
+ *
+ * This function applies a full affine transformation including translation.
+ * The matrix is stored in column-major order as 16 consecutive 32-bit words.
+ *
+ * Arguments:
+ *   a0 = pointer to 4×4 matrix in 16.16 fixed-point (s32[4][4])
+ *   a1 = pointer to s16[3] point (in/out):
+ *          in:  x = *(s16*)(a1+0), y = *(s16*)(a1+2), z = *(s16*)(a1+4)
+ *          out: transformed x, y, z written back to same locations
+ *
+ * Math (per output component):
+ *   out.x = ((x * m[0][0]) + (y * m[1][0]) + (z * m[2][0]) + m[3][0]) >> 16
+ *   out.y = ((x * m[0][1]) + (y * m[1][1]) + (z * m[2][1]) + m[3][1]) >> 16
+ *   out.z = ((x * m[0][2]) + (y * m[1][2]) + (z * m[2][2]) + m[3][2]) >> 16
+ */
 LEAF(mtxs_transform_point)
-    lh         t0, 0x0(a1)
-    lh         t1, 0x2(a1)
-    lh         t2, 0x4(a1)
+    /* Load input point components (s16) */
+    lh         t0, 0x0(a1)              /* t0 = x */
+    lh         t1, 0x2(a1)              /* t1 = y */
+    lh         t2, 0x4(a1)              /* t2 = z */
+
+    /* -------------------
+     * Compute out.x = x*m[0][0] + y*m[0][1] + z*m[0][2] + m[0][3]
+     * ------------------- */
     lw         t3, 0x0(a0)
-    mult       t0, t3
-    mflo       t4
+    MULS       (t4, t0, t3)             /* out.x  = x * m[0][0] */
+
     lw         t3, 0x10(a0)
-    mult       t1, t3
-    mflo       t5
+    MULS       (t5, t1, t3)
+    add        t4, t5                   /* out.x += y * m[0][1] */
+
     lw         t3, 0x20(a0)
-    mult       t2, t3
-    mflo       t6
+    MULS       (t6, t2, t3)
+    add        t4, t6                   /* out.x += z * m[0][2] */
+
     lw         t3, 0x30(a0)
-    add        t4, t5
-    add        t4, t6
-    add        t4, t3
-    sra        t4, 16
-    sh         t4, 0x0(a1)
+    add        t4, t3                   /* out.x += m[0][3] */
+    sra        t4, 16                   /* out.x >>= 16: convert back from 16.16 */
+    sh         t4, 0x0(a1)              /* store out.x */
+
+    /* -------------------
+     * Compute out.y = x*m[1][0] + y*m[1][1] + z*m[1][2] + m[1][3]
+     * ------------------- */
     lw         t3, 0x4(a0)
-    mult       t0, t3
-    mflo       t4
+    MULS       (t4, t0, t3)             /* out.y  = x * m[0][0] */
+
     lw         t3, 0x14(a0)
-    mult       t1, t3
-    mflo       t5
+    MULS       (t5, t1, t3)
+    add        t4, t5                   /* out.y += y * m[0][1] */
+
     lw         t3, 0x24(a0)
-    mult       t2, t3
-    mflo       t6
+    MULS       (t6, t2, t3)
+    add        t4, t6                   /* out.y += z * m[0][2] */
+
     lw         t3, 0x34(a0)
-    add        t4, t5
-    add        t4, t6
-    add        t4, t3
-    sra        t4, 16
-    sh         t4, 0x2(a1)
+    add        t4, t3                   /* out.y += m[0][3] */
+    sra        t4, 16                   /* out.y >>= 16: convert back from 16.16 */
+    sh         t4, 0x2(a1)              /* store out.y */
+
+    /* -------------------
+     * Compute out.z = x*m[2][0] + y*m[2][1] + z*m[2][2] + m[2][3]
+     * ------------------- */
     lw         t3, 0x8(a0)
-    mult       t0, t3
-    mflo       t4
+    MULS       (t4, t0, t3)             /* out.z  = x * m[0][0] */
+
     lw         t3, 0x18(a0)
-    mult       t1, t3
-    mflo       t5
+    MULS       (t5, t1, t3)
+    add        t4, t5                   /* out.z += y * m[0][1] */
+
     lw         t3, 0x28(a0)
-    mult       t2, t3
-    mflo       t6
+    MULS       (t6, t2, t3)
+    add        t4, t6                   /* out.z += z * m[0][2] */
+
     lw         t3, 0x38(a0)
-    add        t4, t5
-    add        t4, t6
-    add        t4, t3
-    sra        t4, 16
-    sh         t4, 0x4(a1)
+    add        t4, t3                   /* out.z += m[0][3] */
+    sra        t4, 16                   /* out.z >>= 16: convert back from 16.16 */
+    sh         t4, 0x4(a1)              /* store out.z */
+
     jr         ra
 END(mtxs_transform_point)
 
+/**
+ * Transforms a 3D direction vector using a 4×4 matrix in 16.16 fixed-point format.
+ *
+ * Unlike mtxs_transform_point, this function ignores the translation column (m[*][3]),
+ * making it suitable for transforming direction vectors and normals.
+ *
+ * Arguments:
+ *   a0 = pointer to 4×4 matrix in 16.16 fixed-point (s32[4][4])
+ *   a1 = pointer to s16[3] direction vector (in/out):
+ *          in:  x = *(s16*)(a1+0), y = *(s16*)(a1+2), z = *(s16*)(a1+4)
+ *          out: transformed x, y, z written back to same locations
+ *
+ * Math (per output component, no translation):
+ *   out.x = ((x * m[0][0]) + (y * m[1][0]) + (z * m[2][0])) >> 16
+ *   out.y = ((x * m[0][1]) + (y * m[1][1]) + (z * m[2][1])) >> 16
+ *   out.z = ((x * m[0][2]) + (y * m[1][2]) + (z * m[2][2])) >> 16
+ */
 LEAF(mtxs_transform_dir)
-    lw         t3, 0x0(a0)
-    lh         t0, 0x0(a1)
-    lh         t1, 0x2(a1)
-    lh         t2, 0x4(a1)
-    mult       t0, t3
+    lw         t3, 0x0(a0)              /* t3 = m[0][0] */
+
+    /* Load input direction vector components (s16) */
+    lh         t0, 0x0(a1)              /* t0 = x */
+    lh         t1, 0x2(a1)              /* t1 = y */
+    lh         t2, 0x4(a1)              /* t2 = z */
+
+    /* -----------------------------------------
+     * Compute out.x = x*m[0][0] + y*m[0][1] + z*m[0][2]
+     * ----------------------------------------- */
+    MULS       (t4, t0, t3)             /* out.x  = x * m[0][0] */
+
     lw         t3, 0x10(a0)
-    mflo       t4
-    mult       t1, t3
+    MULS       (t5, t1, t3)
+    add        t4, t5                   /* out.x += y * m[0][1] */
+
     lw         t3, 0x20(a0)
-    mflo       t5
-    add        t4, t5
-    mult       t2, t3
-    lw         t3, 0x4(a0)
-    mflo       t6
-    add        t4, t6
-    sra        t4, 16
-    mult       t0, t3
-    sh         t4, 0x0(a1)
+    MULS       (t6, t2, t3)
+    add        t4, t6                   /* out.x += z * m[0][2] */
+
+    sra        t4, 16                   /* out.x >>= 16: convert back from 16.16 */
+
+    /* -----------------------------------------
+     * Compute out.y = x*m[1][0] + y*m[1][1] + z*m[1][2]
+     * ----------------------------------------- */
+    lw         t3, 0x4(a0)              /* t3 = m[0x04] (preload for next row) */
+    sh         t4, 0x0(a1)              /* store out.x (delay slot usage) */
+    MULS       (t4, t0, t3)             /* out.y  = x * m[0][0] */
+
     lw         t3, 0x14(a0)
-    mflo       t4
-    mult       t1, t3
+    MULS       (t5, t1, t3)
+    add        t4, t5                   /* out.y += y * m[0][1] */
+
     lw         t3, 0x24(a0)
-    mflo       t5
-    add        t4, t5
-    mult       t2, t3
+    MULS       (t6, t2, t3)
+    add        t4, t6                   /* out.y += z * m[0][2] */
+
+    sra        t4, 16                   /* out.y >>= 16: convert back from 16.16 */
+
+    /* -----------------------------------------
+     * Compute out.z = x*m[2][0] + y*m[2][1] + z*m[2][2]
+     * ----------------------------------------- */
     lw         t3, 0x8(a0)
-    mflo       t6
-    add        t4, t6
-    sra        t4, 16
-    mult       t0, t3
-    sh         t4, 0x2(a1)
+    sh         t4, 0x2(a1)              /* store out.y (delay slot usage) */
+    MULS       (t4, t0, t3)             /* out.z  = x * m[0][0] */
+
     lw         t3, 0x18(a0)
-    mflo       t4
-    mult       t1, t3
+    MULS       (t5, t1, t3)
+    add        t4, t5                   /* out.z += y * m[0][1] */
+
     lw         t3, 0x28(a0)
-    mflo       t5
-    add        t4, t5
-    mult       t2, t3
-    mflo       t6
-    add        t4, t6
-    sra        t4, 16
-    sh         t4, 0x4(a1)
+    MULS       (t6, t2, t3)
+    add        t4, t6                   /* out.z += z * m[0][2] */
+
+    sra        t4, 16                   /* out.z >>= 16: convert back from 16.16 */
+    sh         t4, 0x4(a1)              /* store out.z */
+
     jr         ra
 END(mtxs_transform_dir)
 
+
 LEAF(mtxf_from_transform)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)

From a90fb2d4b25fb22ca556d3227e39976c500c764e Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Mon, 8 Dec 2025 21:22:57 -0500
Subject: [PATCH 12/36] Better vec3s_reflect

---
 src/hasm/ido/math_util.s | 24 ++++++++----------------
 1 file changed, 8 insertions(+), 16 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index e3a672547..48ae65a57 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -673,37 +673,29 @@ LEAF(vec3s_reflect)
     lh         t5, 0x4(a1)              /* normal.z */
     
     /* Calculate dot product: dot = (incident.x * normal.x) + (incident.y * normal.y) + (incident.z * normal.z) */
-    mult       t0, t3                   /* incident.x * normal.x */
-    mflo       t6                       /* dot = result */
-    
-    mult       t1, t4                   /* incident.y * normal.y */
-    mflo       t7                       /* temp = result */
-    add        t6, t7                   /* dot += temp */
-    
-    mult       t2, t5                   /* incident.z * normal.z */
-    mflo       t8                       /* temp = result */
-    add        t6, t8                   /* dot += temp */
+    MULS       (t6, t0, t3)             /* x = incident.x * normal.x */    
+    MULS       (t7, t1, t4)             /* y = incident.y * normal.y */
+    MULS       (t8, t2, t5)             /* z = incident.z * normal.z */
+    add        t6, t7                   /* dot  = x + y */
+    add        t6, t8                   /* dot += z */
     
     /* Scale down accumulated dot product (fixed-point normalization) */
     sra        t6, 12                   /* dot >>= 12 */
     
     /* Calculate reflected.x = (dot * normal.x >> 13) - incident.x */
-    mult       t6, t3                   /* (dot * normal.x) */
-    mflo       t3                       /* scaled_normal_x = result */
+    MULS       (t3, t6, t3)             /* scaled_normal_x = (dot * normal.x) */
     sra        t3, 13                   /* scaled_normal_x >>= 13 */
     sub        t3, t3, t0               /* reflected.x = scaled_normal_x - incident.x */
     sh         t3, 0x6(a0)              /* Store reflected.x */
     
     /* Calculate reflected.y = (dot * normal.y >> 13) - incident.y */
-    mult       t6, t4                   /* (dot * normal.y) */
-    mflo       t4                       /* scaled_normal_y = result */
+    MULS       (t4, t6, t4)             /* scaled_normal_y = (dot * normal.y) */
     sra        t4, 13                   /* scaled_normal_y >>= 13 */
     sub        t4, t4, t1               /* reflected.y = scaled_normal_y - incident.y */
     sh         t4, 0x8(a0)              /* Store reflected.y */
     
     /* Calculate reflected.z = (dot * normal.z >> 13) - incident.z */
-    mult       t6, t5                   /* (dot * normal.z) */
-    mflo       t5                       /* scaled_normal_z = result */
+    MULS       (t5, t6, t5)             /* scaled_normal_z = (dot * normal.z) */
     sra        t5, 13                   /* scaled_normal_z >>= 13 */
 #ifdef AVOID_UB
     sub        t5, t5, t2               /* reflected.z = scaled_normal_z - incident.z */

From 28a1e1938d787e10280e3f5aa63136fc64e09d0a Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Wed, 10 Dec 2025 11:59:38 -0500
Subject: [PATCH 13/36] Better matches with docs

---
 src/hasm/ido/asm_macros.h |  12 +-
 src/hasm/ido/math_util.s  | 440 +++++++++++++++++++++++++-------------
 2 files changed, 299 insertions(+), 153 deletions(-)

diff --git a/src/hasm/ido/asm_macros.h b/src/hasm/ido/asm_macros.h
index 2022ba428..855528e8c 100644
--- a/src/hasm/ido/asm_macros.h
+++ b/src/hasm/ido/asm_macros.h
@@ -4,4 +4,14 @@
 */
 #define MULS(rd, rs, rt) \
     mult   rs, rt; \
-    mflo   rd
\ No newline at end of file
+    mflo   rd \
+
+/* 
+    I think they accidentally used mul instead of mult.
+    This causes issues if they rd and rs are different registers as
+    rs would get overwritten by the mult instruction.
+    It also wastes and extra instruction with the extra mflo at the end.
+*/
+#define MUL(rd, rs, rt) \
+    mul    rs, rt; \
+    mflo   rd /* (mul pseudo-op already does this, but original has it) */ \
\ No newline at end of file
diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 48ae65a57..87b7884cf 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -908,97 +908,189 @@ LEAF(mtxs_transform_dir)
 END(mtxs_transform_dir)
 
 
+/**
+ * Builds a 4×4 floating-point transformation matrix from an ObjectTransform struct.
+ *
+ * This function constructs a rotation matrix from Euler angles (roll, pitch, yaw)
+ * and applies uniform scaling, then sets the translation column.
+ *
+ * Arguments:
+ *   a0 = pointer to destination 4×4 float matrix (MtxF)
+ *   a1 = pointer to ObjectTransform struct:
+ *          0x00: s16 rotation.x (roll)
+ *          0x02: s16 rotation.y (pitch)
+ *          0x04: s16 rotation.z (yaw)
+ *          0x06: s16 (padding)
+ *          0x08: f32 scale (uniform)
+ *          0x0C: f32 position.x
+ *          0x10: f32 position.y
+ *          0x14: f32 position.z
+ *
+ * The rotation order is: Roll (X) -> Pitch (Y) -> Yaw (Z)
+ *
+ * Matrix layout (column-major):
+ *   [ m00 m01 m02  0  ]   row 0
+ *   [ m10 m11 m12  0  ]   row 1
+ *   [ m20 m21 m22  0  ]   row 2
+ *   [ tx  ty  tz   1  ]   row 3 (translation + homogeneous)
+ */
 LEAF(mtxf_from_transform)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
 
-    move       a3, a0
-    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
-    lh         a0, 0x0(a1)
-    jal        sins_s16
-    mtc1       v0, fv0
-    lh         a0, 0x0(a1)
-    cvt.s.w    fv0
-    mul.s      fv0, ft5
-    jal        coss_s16
-    mtc1       v0, fv1
-    lh         a0, 0x2(a1)
-    cvt.s.w    fv1
-    mul.s      fv1, ft5
-    jal        sins_s16
-    mtc1       v0, ft0
-    lh         a0, 0x2(a1)
-    cvt.s.w    ft0
-    mul.s      ft0, ft5
-    jal        coss_s16
-    mtc1       v0, ft1
-    lh         a0, 0x4(a1)
-    cvt.s.w    ft1
-    mul.s      ft1, ft5
-    jal        sins_s16
-    mtc1       v0, ft2
-    lh         a0, 0x4(a1)
-    cvt.s.w    ft2
-    mul.s      ft2, ft5
-    jal        coss_s16
-    mtc1       v0, ft3
-    lw         t2, 0x8(a1)
-    sw         zero, 0xC(a3)
-    cvt.s.w    ft3, ft3
-    sw         zero, 0x1C(a3)
-    sw         zero, 0x2C(a3)
-    mul.s      ft3, ft3, ft5
-    mul.s      ft4, ft0, fv0
-    mul.s      ft4, ft2
-    mul.s      ft5, ft3, fv1
-    add.s      ft4, ft5
-    mtc1       t2, ft5
-    mul.s      ft4, ft5
-    swc1       ft4, 0x0(a3)
-    mul.s      ft4, ft2, ft1
-    mul.s      ft4, ft5
-    swc1       ft4, 0x4(a3)
-    mul.s      ft4, ft0, fv1
-    mul.s      ft4, ft2
-    mul.s      ft5, ft3, fv0
-    sub.s      ft4, ft5
-    mtc1       t2, ft5
-    mul.s      ft4, ft5
-    swc1       ft4, 0x8(a3)
+    move       a3, a0                   /* a3 = dest matrix pointer */
+    li.s       ft5, 0.0000152587890625  /* ft5 = 1.0f / 0x10000 (s16 to float scale) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for roll (rotation.x)
+     * ----------------------------------------- */
+    lh         a0, 0x0(a1)              /* a0 = transform->rotation.x (roll angle) */
+    jal        sins_s16                 /* v0 = sin(roll) as s16 */
+    mtc1       v0, fv0                  /* fv0 = sin(roll) as int bits */
+    lh         a0, 0x0(a1)              /* a0 = transform->rotation.x */
+    cvt.s.w    fv0                      /* fv0 = (float)sin(roll) */
+    mul.s      fv0, ft5                 /* fv0 = sinRoll (normalized) */
+    jal        coss_s16                 /* v0 = cos(roll) as s16 */
+    mtc1       v0, fv1                  /* fv1 = cos(roll) as int bits */
+    cvt.s.w    fv1                      /* fv1 = (float)cos(roll) */
+    mul.s      fv1, ft5                 /* fv1 = cosRoll (normalized) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for pitch (rotation.y)
+     * ----------------------------------------- */
+    lh         a0, 0x2(a1)              /* a0 = transform->rotation.y (pitch angle) */
+    jal        sins_s16                 /* v0 = sin(pitch) as s16 */
+    mtc1       v0, ft0                  /* ft0 = sin(pitch) as int bits */
+    lh         a0, 0x2(a1)              /* a0 = transform->rotation.y */
+    cvt.s.w    ft0                      /* ft0 = (float)sin(pitch) */
+    mul.s      ft0, ft5                 /* ft0 = sinPitch (normalized) */
+    jal        coss_s16                 /* v0 = cos(pitch) as s16 */
+    mtc1       v0, ft1                  /* ft1 = cos(pitch) as int bits */
+    cvt.s.w    ft1                      /* ft1 = (float)cos(pitch) */
+    mul.s      ft1, ft5                 /* ft1 = cosPitch (normalized) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for yaw (rotation.z)
+     * ----------------------------------------- */
+    lh         a0, 0x4(a1)              /* a0 = transform->rotation.z (yaw angle) */
+    jal        sins_s16                 /* v0 = sin(yaw) as s16 */
+    mtc1       v0, ft2                  /* ft2 = sin(yaw) as int bits */
+    lh         a0, 0x4(a1)              /* a0 = transform->rotation.z */
+    cvt.s.w    ft2                      /* ft2 = (float)sin(yaw) */
+    mul.s      ft2, ft5                 /* ft2 = sinYaw (normalized) */
+    jal        coss_s16                 /* v0 = cos(yaw) as s16 */
+    mtc1       v0, ft3                  /* ft3 = cos(yaw) as int bits */
+    cvt.s.w    ft3, ft3                 /* ft3 = (float)cos(yaw) */
+    mul.s      ft3, ft5                 /* ft3 = cosYaw (normalized) */
+
+    /* -----------------------------------------
+     * Build rotation matrix with scale applied
+     * 
+     * Register usage at this point:
+     *   fv0 = sinRoll,  fv1 = cosRoll
+     *   ft0 = sinPitch, ft1 = cosPitch
+     *   ft2 = sinYaw,   ft3 = cosYaw
+     *   ft5 = scale factor (loaded below)
+     * ----------------------------------------- */
+    lw         t2, 0x8(a1)              /* t2 = transform->scale (as int bits) */
+    sw         zero, 0xC(a3)            /* m[0][3] = 0.0 */
+    sw         zero, 0x1C(a3)           /* m[1][3] = 0.0 */
+    sw         zero, 0x2C(a3)           /* m[2][3] = 0.0 */
+
+    /* -----------------------------------------
+     * Compute m[0][0] = (sinPitch * sinRoll * sinYaw + cosYaw * cosRoll) * scale
+     * ----------------------------------------- */
     mul.s      ft4, ft0, fv0
-    mul.s      ft4, ft3
-    mul.s      ft5, ft2, fv1
-    sub.s      ft4, ft5
-    mtc1       t2, ft5
-    mul.s      ft4, ft5
-    swc1       ft4, 0x10(a3)
-    mul.s      ft4, ft3, ft1
-    mul.s      ft4, ft5
-    swc1       ft4, 0x14(a3)
-    mul.s      ft4, ft0, fv1
-    mul.s      ft4, ft3
-    mul.s      ft5, ft2, fv0
-    add.s      ft4, ft5
-    mtc1       t2, ft5
-    mul.s      ft4, ft5
-    swc1       ft4, 0x18(a3)
-    mul.s      ft4, ft1, fv0
-    mul.s      ft4, ft5
-    swc1       ft4, 0x20(a3)
-    mul.s      ft4, ft0, ft5
-    neg.s      ft4
-    swc1       ft4, 0x24(a3)
-    mul.s      ft4, ft1, fv1
-    mul.s      ft4, ft5
-    swc1       ft4, 0x28(a3)
-    lw         t0, 0xC(a1)
-    sw         t0, 0x30(a3)
-    lw         t0, 0x10(a1)
-    sw         t0, 0x34(a3)
-    lw         t0, 0x14(a1)
-    sw         t0, 0x38(a3)
+    mul.s      ft4, ft4, ft2            /* ft4 = sinPitch * sinRoll * sinYaw */
+    mul.s      ft5, ft3, fv1            /* ft5 = cosYaw * cosRoll */
+    add.s      ft4, ft5                 /* ft4 = (sp*sr*sy + cy*cr) */
+    mtc1       t2, ft5                  /* ft5 = scale (as float bits) */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x0(a3)             /* m[0][0] = (sp*sr*sy + cy*cr) * scale */
+
+    /* -----------------------------------------
+     * Compute m[0][1] = sinYaw * cosPitch * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft2, ft1            /* ft4 = sinYaw * cosPitch */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x4(a3)             /* m[0][1] = sinYaw * cosPitch * scale */
+
+    /* -----------------------------------------
+     * Compute m[0][2] = (sinPitch * cosRoll * sinYaw - cosYaw * sinRoll) * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, fv1            /* ft4 = sinPitch * cosRoll */
+    mul.s      ft4, ft2                 /* ft4 = sinPitch * cosRoll * sinYaw */
+    mul.s      ft5, ft3, fv0            /* ft5 = cosYaw * sinRoll */
+    sub.s      ft4, ft5                 /* ft4 = (sp*cr*sy - cy*sr) */
+    mtc1       t2, ft5                  /* ft5 = scale */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x8(a3)             /* m[0][2] = result */
+
+    /* -----------------------------------------
+     * Compute m[1][0] = (sinPitch * sinRoll * cosYaw - sinYaw * cosRoll) * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, fv0            /* ft4 = sinPitch * sinRoll */
+    mul.s      ft4, ft3                 /* ft4 = sinPitch * sinRoll * cosYaw */
+    mul.s      ft5, ft2, fv1            /* ft5 = sinYaw * cosRoll */
+    sub.s      ft4, ft5                 /* ft4 = (sp*sr*cy - sy*cr) */
+    mtc1       t2, ft5                  /* ft5 = scale */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x10(a3)            /* m[1][0] = result */
+
+    /* -----------------------------------------
+     * Compute m[1][1] = cosYaw * cosPitch * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft3, ft1            /* ft4 = cosYaw * cosPitch */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x14(a3)            /* m[1][1] = result */
+
+    /* -----------------------------------------
+     * Compute m[1][2] = (sinPitch * cosRoll * cosYaw + sinYaw * sinRoll) * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, fv1            /* ft4 = sinPitch * cosRoll */
+    mul.s      ft4, ft3                 /* ft4 = sinPitch * cosRoll * cosYaw */
+    mul.s      ft5, ft2, fv0            /* ft5 = sinYaw * sinRoll */
+    add.s      ft4, ft5                 /* ft4 = (sp*cr*cy + sy*sr) */
+    mtc1       t2, ft5                  /* ft5 = scale */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x18(a3)            /* m[1][2] = result */
+
+    /* -----------------------------------------
+     * Compute m[2][0] = cosPitch * sinRoll * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft1, fv0            /* ft4 = cosPitch * sinRoll */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x20(a3)            /* m[2][0] = result */
+
+    /* -----------------------------------------
+     * Compute m[2][1] = -sinPitch * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, ft5            /* ft4 = sinPitch * scale */
+    neg.s      ft4                      /* ft4 = -sinPitch * scale */
+    swc1       ft4, 0x24(a3)            /* m[2][1] = result */
+
+    /* -----------------------------------------
+     * Compute m[2][2] = cosPitch * cosRoll * scale
+     * ----------------------------------------- */
+    mul.s      ft4, ft1, fv1            /* ft4 = cosPitch * cosRoll */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x28(a3)            /* m[2][2] = result */
+
+    /* -----------------------------------------
+     * Set translation column from transform position
+     * ----------------------------------------- */
+    lw         t0, 0xC(a1)              /* t0 = transform->position.x */
+    sw         t0, 0x30(a3)             /* m[3][0] = position.x */
+    lw         t0, 0x10(a1)             /* t0 = transform->position.y */
+    sw         t0, 0x34(a3)             /* m[3][1] = position.y */
+    lw         t0, 0x14(a1)             /* t0 = transform->position.z */
+    sw         t0, 0x38(a3)             /* m[3][2] = position.z */
+
+    /* -----------------------------------------
+     * Set homogeneous coordinate
+     * ----------------------------------------- */
     li.s       ft5, 1.0
-    swc1       ft5, 0x3C(a3)
+    swc1       ft5, 0x3C(a3)            /* m[3][3] = 1.0 */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8
@@ -1449,71 +1541,95 @@ LEAF(vec3f_rotate_py)
     jr         ra
 END(vec3f_rotate_py)
 
-/* Official Name: mathXZInTri */
+/**
+ * Tests if a 2D point (x, z) lies inside a triangle defined by three vertices.
+ *
+ * Official Name: mathXZInTri
+ *
+ * Uses the cross-product sign test: for each edge of the triangle, compute
+ * the cross product of (point - vertex) × (next_vertex - vertex). If all
+ * three cross products have the same sign (all positive or all negative),
+ * the point is inside the triangle.
+ *
+ * Arguments:
+ *   a0 = x coordinate of test point
+ *   a1 = z coordinate of test point
+ *   a2 = pointer to Vec3s pointA (uses x at offset 0x0, z at offset 0x4)
+ *   a3 = pointer to Vec3s pointB (uses x at offset 0x0, z at offset 0x4)
+ *   sp+0x10 = pointer to Vec3s pointC (uses x at offset 0x0, z at offset 0x4)
+ *
+ * Returns:
+ *   v0 = 1 if point is inside triangle, 0 otherwise
+ *
+ * Note: The cross product for edge A->B is computed as:
+ *   cross = (x - A.x) * (B.z - A.z) - (B.x - A.x) * (z - A.z)
+ *   sign = (cross >= 0) ? 1 : 0
+ */
 LEAF(tri2d_xz_contains_point)
-.set noreorder
-lw         t6, 0x10(sp)
-lh         t0, 0x0(a2)
-lh         t1, 0x4(a2)
-lh         t3, 0x4(a3)
-lh         t4, 0x0(t6)
-lh         t5, 0x4(t6)
-sub        t6, a0, t0
-sub        t7, t3, t1
-multu      t6, t7
-lh         t2, 0x0(a3)
-sub        t9, a1, t1
-addiu      v0, zero, 0x0
-sub        t8, t2, t0
-ori        a3, zero, 0x1
-mflo       t6
-mflo       t6
-nop
-nop
-multu      t8, t9
-mflo       t7
-mflo       t8
-sub        t6, t6, t7
-bgezl      t6, .L80070558
-.set reorder
-sub        t6, a0, t2
-xor        a3, a3, a3
-sub        t6, a0, t2
-.L80070558:
-sub        t7, t5, t3
-multu      t6, t7
-sub        t8, t4, t2
-sub        t9, a1, t3
-ori        a2, zero, 0x1
-mflo       t6
-mflo       t6
-multu      t8, t9
-mflo       t7
-mflo       t8
-sub        t6, t6, t7
-bgez       t6, .L80070598
-xor        a2, a2, a2
-.L80070598:
-bne        a3, a2, .L800705F0
-sub        t6, a0, t4
-sub        t7, t1, t5
-multu      t6, t7
-sub        t8, t0, t4
-sub        t9, a1, t5
-ori        a1, zero, 0x1
-mflo       t6
-mflo       t6
-multu      t8, t9
-mflo       t7
-mflo       t8
-sub        t6, t6, t7
-bgez       t6, .L800705E4
-xor        a1, a1, a1
-.L800705E4:
-bne        a1, a2, .L800705F0
-ori        v0, zero, 0x1
-.L800705F0:
-jr         ra
+    /* Load pointC from stack and extract all vertex coordinates */
+    lw         t6, 0x10(sp)             /* t6 = pointC */
+    li         v0, 0                    /* v0 = 0 (default: point outside) */
+    lh         t0, 0x0(a2)              /* t0 = A.x */
+    lh         t1, 0x4(a2)              /* t1 = A.z */
+    lh         t2, 0x0(a3)              /* t2 = B.x */
+    lh         t3, 0x4(a3)              /* t3 = B.z */
+    lh         t4, 0x0(t6)              /* t4 = C.x */
+    lh         t5, 0x4(t6)              /* t5 = C.z */
+
+    /* -----------------------------------------
+     * Edge A->B: cross = (x - A.x) * (B.z - A.z) - (B.x - A.x) * (z - A.z)
+     * ----------------------------------------- */
+    sub        t6, a0, t0               /* t6 = x - A.x */
+    sub        t7, t3, t1               /* t7 = B.z - A.z */
+    MUL        (t6, t6, t7)             /* t6 = (x - A.x) * (B.z - A.z) */
+    sub        t8, t2, t0               /* t8 = B.x - A.x */
+    sub        t9, a1, t1               /* t9 = z - A.z */
+    MUL        (t7, t8, t9)             /* t7 and t8 = (B.x - A.x) * (z - A.z) */
+    sub        t6, t7                   /* t6 = cross product for edge A->B */
+    ori        a3, zero, 1              /* a3 = 1 (assume positive) */
+    bgez       t6, .edge_ab_positive
+    xor        a3, a3                   /* a3 = 0 (cross was negative) */
+
+.edge_ab_positive:
+    /* -----------------------------------------
+     * Edge B->C: cross = (x - B.x) * (C.z - B.z) - (C.x - B.x) * (z - B.z)
+     * ----------------------------------------- */
+    sub        t6, a0, t2               /* t6 = x - B.x */
+    sub        t7, t5, t3               /* t7 = C.z - B.z */
+    MUL        (t6, t6, t7)             /* t6 = (x - B.x) * (C.z - B.z) */
+    sub        t8, t4, t2               /* t8 = C.x - B.x */
+    sub        t9, a1, t3               /* t9 = z - B.z */
+    MUL        (t7, t8, t9)             /* t7 and t8 = (C.x - B.x) * (z - B.z) */    
+    sub        t6, t6, t7               /* t6 = cross product for edge B->C */
+    ori        a2, zero, 1              /* a2 = 1 (assume positive) */
+    bgez       t6, .edge_bc_positive
+    xor        a2, a2                   /* a2 = 0 (cross was negative) */
+
+.edge_bc_positive:
+    /* If sign of edge A->B != sign of edge B->C, point is outside */
+    bne        a3, a2, .point_outside
+
+    /* -----------------------------------------
+     * Edge C->A: cross = (x - C.x) * (A.z - C.z) - (A.x - C.x) * (z - C.z)
+     * ----------------------------------------- */
+    sub        t6, a0, t4               /* t6 = x - C.x */
+    sub        t7, t1, t5               /* t7 = A.z - C.z */
+    MUL        (t6, t6, t7)             /* t6 = (x - C.x) * (A.z - C.z) */
+    sub        t8, t0, t4               /* t8 = A.x - C.x */
+    sub        t9, a1, t5               /* t9 = z - C.z */
+    MUL        (t7, t8, t9)             /* t7 and t8 = (A.x - C.x) * (z - C.z) */    
+    sub        t6, t7                   /* t6 = cross product for edge C->A */
+    ori        a1, zero, 1              /* a1 = 1 (assume positive) */
+    bgez       t6, .edge_ca_positive
+    xor        a1, a1                   /* a1 = 0 (cross was negative) */
+
+.edge_ca_positive:
+    /* If sign of edge C->A != sign of edge B->C, point is outside */
+    bne        a1, a2, .point_outside
+    ori        v0, zero, 1              /* All signs match: point is inside */
+
+.point_outside:
+    jr         ra
 END(tri2d_xz_contains_point)
 
 /* Official Name: mathTranslateMtx */
@@ -1657,10 +1773,30 @@ LEAF(fix32_sqrt)
     jr         ra
 END(fix32_sqrt)
 
+/**
+ * Computes the square root of an integer, incorrectly.
+ *
+ * !@bug: This function is broken because it interprets the integer input
+ * as if it were already a floating-point bit pattern, rather than converting
+ * it properly. The `sqrt.s` instruction expects a float, but `mtc1` without
+ * `cvt.s.w` just moves the raw integer bits into the FPU register.
+ *
+ * Arguments:
+ *   a0 = integer value (but treated incorrectly as float bits)
+ *
+ * Returns:
+ *   v0 = garbage result (raw float bits of sqrt interpreted as integer)
+ */
 LEAF(bad_int_sqrt)
-    mtc1       a0, fv0
-    sqrt.s     fv0
-    mfc1       v0, fv0
+    mtc1       a0, fv0      /* !@bug: moves int bits directly, no conversion */
+#ifdef AVOID_UB
+    cvt.s.w    fv0          /* This would fix the bug by converting the int to a float */
+    sqrt.s     fv0          /* compute sqrt */
+    cvt.w.s    fv0          /* convert the float back to an int */
+#else
+    sqrt.s     fv0          /* computes sqrt of garbage float interpretation */
+#endif
+    mfc1       v0, fv0      /* returns raw float bits as integer */
     jr         ra
 END(bad_int_sqrt)
 

From 6f2e827e082e8cc27e10d485630ec32ac84bee97 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Wed, 10 Dec 2025 14:40:54 -0500
Subject: [PATCH 14/36] Doc mtxf_from_inverse_transform

---
 src/hasm/ido/math_util.s | 414 ++++++++++++++++++++++++++-------------
 1 file changed, 281 insertions(+), 133 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 87b7884cf..f68db524c 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -208,9 +208,9 @@ LEAF(get_gIntDisFlag)
 END(get_gIntDisFlag)
 
 /**
- * Converts a Mtx (fixed-point matrix with split integer and fractional parts)
- * into a 4×4 matrix of 32-bit signed integers, where each element is in 16.16 fixed-point format.
- *
+ * Converts a Mtx (fixed-point matrix with split integer and fractional parts)
+ * into a 4×4 matrix of 32-bit signed integers, where each element is in 16.16 fixed-point format.
+ *
  * Arguments:
  *   a0 = pointer to source fixed-point matrix (Mtx) in N64 format
  *   a1 = pointer to destination short matrix (Mtxs)
@@ -262,8 +262,8 @@ LEAF(mtx_to_mtxs)
 END(mtx_to_mtxs)
 
 /**
- * Converts a 4×4 matrix of 32-bit floating-point values into a 4×4 matrix
- * of 32-bit signed fixed-point values in 16.16 format.
+ * Converts a 4×4 matrix of 32-bit floating-point values into a 4×4 matrix
+ * of 32-bit signed fixed-point values in 16.16 format.
  *
  * Arguments:
  *   a0 = pointer to source floating-point matrix (MtxF)
@@ -1097,152 +1097,300 @@ LEAF(mtxf_from_transform)
     jr         ra
 END(mtxf_from_transform)
 
-/* Official Name: mathSquashY */
+/**
+ * Scales the Y axis of the given 4×4 transformation matrix by the specified factor.
+ * If this is a model matrix, the operation is equivalent to stretching or squashing
+ * the model along its local Y axis.
+ *
+ * Official Name: mathSquashY
+ *
+ * Arguments:
+ *   a0 = pointer to 4×4 float matrix (MtxF)
+ *   a1 = scale factor (passed as raw float bits in integer register)
+ *
+ * Operation:
+ *   mtx[1][0] *= scale
+ *   mtx[1][1] *= scale
+ *   mtx[1][2] *= scale
+ */
 LEAF(mtxf_scale_y)
-    mtc1       a1, ft5
+    mtc1       a1, ft5                  /* ft5 = scale factor */
+
+    /* Scale mtx[1][0] */
+    lwc1       ft4, 0x10(a0)            /* ft4 = mtx[1][0] */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x10(a0)            /* store mtx[1][0] */
 
-    lwc1       ft4, 0x10(a0)
-    mul.s      ft4, ft5
-    swc1       ft4, 0x10(a0)
+    /* Scale mtx[1][1] */
 #ifdef AVOID_UB
-    lwc1       ft4, 0x14(a0)
+    lwc1       ft4, 0x14(a0)            /* ft4 = mtx[1][1] */
 #else
-    lwc1       ft4, 0x14(a3) /* UB: Should be a0, and this was actually fixed in JFG */
+    lwc1       ft4, 0x14(a3)            /* !@bug: Should be a0, reads garbage from a3, this was actually fixed in JFG */
 #endif
-    mul.s      ft4, ft5
-    swc1       ft4, 0x14(a0)
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x14(a0)            /* store mtx[1][1] */
 
-    lwc1       ft4, 0x18(a0)
-    mul.s      ft4, ft5
-    swc1       ft4, 0x18(a0)
+    /* Scale mtx[1][2] */
+    lwc1       ft4, 0x18(a0)            /* ft4 = mtx[1][2] */
+    mul.s      ft4, ft5                 /* ft4 *= scale */
+    swc1       ft4, 0x18(a0)            /* store mtx[1][2] */
 
     jr         ra
 END(mtxf_scale_y)
 
-/* Official Name: mathTransY */
+/**
+ * Modifies the matrix by translating its position along the local Y axis.
+ * If this is a model matrix, the operation is equivalent to moving the model
+ * along its local Y axis in model space.
+ *
+ * Official Name: mathTransY
+ *
+ * Arguments:
+ *   a0 = pointer to 4×4 float matrix (MtxF)
+ *   a1 = offset (passed as raw float bits in integer register)
+ *
+ * Operation:
+ *   mtx[3][0] += mtx[1][0] * offset
+ *   mtx[3][1] += mtx[1][1] * offset
+ *   mtx[3][2] += mtx[1][2] * offset
+ *
+ * This moves the translation component of the matrix along the local Y axis
+ * direction by the specified offset amount.
+ */
 LEAF(mtxf_translate_y)
-    mtc1       a1, ft4
-    lwc1       fv0, 0x10(a0)
-    lwc1       ft0, 0x14(a0)
-    lwc1       ft2, 0x18(a0)
-    lwc1       fv1, 0x30(a0)
-    lwc1       ft1, 0x34(a0)
-    lwc1       ft3, 0x38(a0)
-    mul.s      fv0, ft4
-    mul.s      ft0, ft4
-    mul.s      ft2, ft4
-    add.s      fv0, fv1
-    add.s      ft0, ft1
-    add.s      ft2, ft3
-    swc1       fv0, 0x30(a0)
-    swc1       ft0, 0x34(a0)
-    swc1       ft2, 0x38(a0)
+    mtc1       a1, ft4                  /* ft4 = offset */
+
+    /* Load Y-axis basis vector (row 1) */
+    lwc1       fv0, 0x10(a0)            /* fv0 = mtx[1][0] */
+    lwc1       ft0, 0x14(a0)            /* ft0 = mtx[1][1] */
+    lwc1       ft2, 0x18(a0)            /* ft2 = mtx[1][2] */
+
+    /* Load current translation (row 3) */
+    lwc1       fv1, 0x30(a0)            /* fv1 = mtx[3][0] */
+    lwc1       ft1, 0x34(a0)            /* ft1 = mtx[3][1] */
+    lwc1       ft3, 0x38(a0)            /* ft3 = mtx[3][2] */
+
+    /* Scale Y-axis by offset */
+    mul.s      fv0, ft4                 /* fv0 = mtx[1][0] * offset */
+    mul.s      ft0, ft4                 /* ft0 = mtx[1][1] * offset */
+    mul.s      ft2, ft4                 /* ft2 = mtx[1][2] * offset */
+
+    /* Add scaled Y-axis to translation */
+    add.s      fv0, fv1                 /* fv0 = mtx[3][0] + mtx[1][0] * offset */
+    add.s      ft0, ft1                 /* ft0 = mtx[3][1] + mtx[1][1] * offset */
+    add.s      ft2, ft3                 /* ft2 = mtx[3][2] + mtx[1][2] * offset */
+
+    /* Store updated translation */
+    swc1       fv0, 0x30(a0)            /* mtx[3][0] = result */
+    swc1       ft0, 0x34(a0)            /* mtx[3][1] = result */
+    swc1       ft2, 0x38(a0)            /* mtx[3][2] = result */
+
     jr         ra
 END(mtxf_translate_y)
 
-/* Official Name: mathRpyXyzMtx */
+/**
+ * Builds an inverse 4×4 floating-point transformation matrix from an ObjectTransform struct.
+ *
+ * This function constructs the inverse of a rotation matrix from Euler angles (roll, pitch, yaw)
+ * and applies the inverse translation. This is useful for transforming world-space coordinates
+ * into object-local space (e.g., for camera view matrices).
+ *
+ * Official Name: mathRpyXyzMtx
+ *
+ * Arguments:
+ *   a0 = pointer to destination 4×4 float matrix (MtxF)
+ *   a1 = pointer to ObjectTransform struct:
+ *          0x00: s16 rotation.x (roll)
+ *          0x02: s16 rotation.y (pitch)
+ *          0x04: s16 rotation.z (yaw)
+ *          0x06: s16 (padding)
+ *          0x08: f32 scale (UNUSED in this function)
+ *          0x0C: f32 position.x
+ *          0x10: f32 position.y
+ *          0x14: f32 position.z
+ *
+ * The inverse rotation is computed by transposing the rotation matrix.
+ * The inverse translation is: R^T * position (not negated here)
+ *
+ * Register usage after trig calculations:
+ *   fv0 = sinRoll,  fv1 = cosRoll
+ *   ft0 = sinPitch, ft1 = cosPitch
+ *   ft2 = sinYaw,   ft3 = cosYaw
+ *
+ * Matrix layout (row-major):
+ *   [ m00 m01 m02  0  ]   row 0
+ *   [ m10 m11 m12  0  ]   row 1
+ *   [ m20 m21 m22  0  ]   row 2
+ *   [ tx  ty  tz   1  ]   row 3 (inverse translation + homogeneous)
+ */
 LEAF(mtxf_from_inverse_transform)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
 
-    move       a3, a0
-    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
-    lh         a0, 0x0(a1)
-    jal        sins_s16
-    mtc1       v0, fv0
-    cvt.s.w    fv0
-    mul.s      fv0, ft5
-    lh         a0, 0x0(a1)
-    jal        coss_s16
-    mtc1       v0, fv1
-    cvt.s.w    fv1
-    mul.s      fv1, ft5
-    lh         a0, 0x2(a1)
-    jal        sins_s16
-    mtc1       v0, ft0
-    cvt.s.w    ft0
-    mul.s      ft0, ft5
-    lh         a0, 0x2(a1)
-    jal        coss_s16
-    mtc1       v0, ft1
-    cvt.s.w    ft1
-    mul.s      ft1, ft5
-    lh         a0, 0x4(a1)
-    jal        sins_s16
-    mtc1       v0, ft2
-    cvt.s.w    ft2
-    mul.s      ft2, ft5
-    lh         a0, 0x4(a1)
-    jal        coss_s16
-    mtc1       v0, ft3
-    cvt.s.w    ft3
-    sw         zero, 0xC(a3)
-    swc1       ft0, 0x18(a3)
-    sw         zero, 0x1C(a3)
-    sw         zero, 0x2C(a3)
-    mul.s      ft3, ft5
-    mul.s      ft4, ft0, ft2
-    mul.s      ft4, fv0
-    mul.s      ft5, fv1, ft3
-    sub.s      ft4, ft5, ft4
-    swc1       ft4, 0x0(a3)
-    mul.s      ft4, ft0, ft3
-    mul.s      ft4, fv0
-    mul.s      ft5, fv1, ft2
-    add.s      ft4, ft5
-    swc1       ft4, 0x4(a3)
-    mul.s      ft4, fv0, ft1
-    neg.s      ft4
-    swc1       ft4, 0x8(a3)
-    mul.s      ft4, ft1, ft2
-    neg.s      ft4
-    swc1       ft4, 0x10(a3)
-    mul.s      ft4, ft1, ft3
-    swc1       ft4, 0x14(a3)
-    mul.s      ft4, ft0, ft2
-    mul.s      ft4, fv1
-    mul.s      ft5, fv0, ft3
-    add.s      ft4, ft5
-    swc1       ft4, 0x20(a3)
-    mul.s      ft4, ft0, ft3
-    mul.s      ft4, fv1
-    mul.s      ft5, fv0, ft2
-    sub.s      ft4, ft5, ft4
-    lwc1       ft5, 0x0(a3)
-    swc1       ft4, 0x24(a3)
-    mul.s      ft4, fv1, ft1
-    swc1       ft4, 0x28(a3)
-    lwc1       fv0, 0xC(a1)
-    lwc1       fv1, 0x10(a1)
-    lwc1       ft4, 0x10(a3)
-    mul.s      ft5, fv0
-    lwc1       ft0, 0x14(a1)
-    mul.s      ft4, fv1
-    add.s      ft4, ft5
-    lwc1       ft5, 0x20(a3)
-    mul.s      ft5, ft0
-    add.s      ft4, ft5
-    lwc1       ft5, 0x4(a3)
-    swc1       ft4, 0x30(a3)
-    mul.s      ft5, fv0
-    lwc1       ft4, 0x14(a3)
-    mul.s      ft4, fv1
-    add.s      ft4, ft5
-    lwc1       ft5, 0x24(a3)
-    mul.s      ft5, ft0
-    add.s      ft4, ft5
-    lwc1       ft5, 0x8(a3)
-    swc1       ft4, 0x34(a3)
-    mul.s      ft5, fv0
-    lwc1       ft4, 0x18(a3)
-    mul.s      ft4, fv1
-    add.s      ft4, ft5
-    lwc1       ft5, 0x28(a3)
-    mul.s      ft5, ft0
-    add.s      ft4, ft5
-    swc1       ft4, 0x38(a3)
+    move       a3, a0                   /* a3 = dest matrix pointer */
+    li.s       ft5, 0.0000152587890625  /* ft5 = 1.0f / 0x10000 (s16 to float scale) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for roll (rotation.x)
+     * ----------------------------------------- */
+    lh         a0, 0x0(a1)              /* a0 = transform->rotation.x (roll angle) */
+    jal        sins_s16                 /* v0 = sin(roll) as s16 */
+    mtc1       v0, fv0                  /* fv0 = sin(roll) as int bits */
+    cvt.s.w    fv0                      /* fv0 = (float)sin(roll) */
+    mul.s      fv0, ft5                 /* fv0 = sinRoll (normalized) */
+    lh         a0, 0x0(a1)              /* a0 = transform->rotation.x */
+    jal        coss_s16                 /* v0 = cos(roll) as s16 */
+    mtc1       v0, fv1                  /* fv1 = cos(roll) as int bits */
+    cvt.s.w    fv1                      /* fv1 = (float)cos(roll) */
+    mul.s      fv1, ft5                 /* fv1 = cosRoll (normalized) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for pitch (rotation.y)
+     * ----------------------------------------- */
+    lh         a0, 0x2(a1)              /* a0 = transform->rotation.y (pitch angle) */
+    jal        sins_s16                 /* v0 = sin(pitch) as s16 */
+    mtc1       v0, ft0                  /* ft0 = sin(pitch) as int bits */
+    cvt.s.w    ft0                      /* ft0 = (float)sin(pitch) */
+    mul.s      ft0, ft5                 /* ft0 = sinPitch (normalized) */
+    lh         a0, 0x2(a1)              /* a0 = transform->rotation.y */
+    jal        coss_s16                 /* v0 = cos(pitch) as s16 */
+    mtc1       v0, ft1                  /* ft1 = cos(pitch) as int bits */
+    cvt.s.w    ft1                      /* ft1 = (float)cos(pitch) */
+    mul.s      ft1, ft5                 /* ft1 = cosPitch (normalized) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for yaw (rotation.z)
+     * ----------------------------------------- */
+    lh         a0, 0x4(a1)              /* a0 = transform->rotation.z (yaw angle) */
+    jal        sins_s16                 /* v0 = sin(yaw) as s16 */
+    mtc1       v0, ft2                  /* ft2 = sin(yaw) as int bits */
+    cvt.s.w    ft2                      /* ft2 = (float)sin(yaw) */
+    mul.s      ft2, ft5                 /* ft2 = sinYaw (normalized) */
+    lh         a0, 0x4(a1)              /* a0 = transform->rotation.z */
+    jal        coss_s16                 /* v0 = cos(yaw) as s16 */
+    mtc1       v0, ft3                  /* ft3 = cos(yaw) as int bits */
+    cvt.s.w    ft3                      /* ft3 = (float)cos(yaw) */
+    mul.s      ft3, ft5                 /* ft3 = cosYaw (normalized) */
+
+    /* -----------------------------------------
+     * Build inverse rotation matrix (transpose of forward rotation)
+     * 
+     * Register usage at this point:
+     *   fv0 = sinRoll,  fv1 = cosRoll
+     *   ft0 = sinPitch, ft1 = cosPitch
+     *   ft2 = sinYaw,   ft3 = cosYaw
+     * ----------------------------------------- */
+
+    /* Clear perspective column and set m[1][2] = sinPitch */
+    sw         zero, 0xC(a3)            /* m[0][3] = 0.0 */
+    swc1       ft0, 0x18(a3)            /* m[1][2] = sinPitch */
+    sw         zero, 0x1C(a3)           /* m[1][3] = 0.0 */
+    sw         zero, 0x2C(a3)           /* m[2][3] = 0.0 */
+
+    /* -----------------------------------------
+     * m[0][0] = cosRoll * cosYaw - sinPitch * sinYaw * sinRoll
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, ft2            /* ft4 = sinPitch * sinYaw */
+    mul.s      ft4, fv0                 /* ft4 = sinPitch * sinYaw * sinRoll */
+    mul.s      ft5, fv1, ft3            /* ft5 = cosRoll * cosYaw */
+    sub.s      ft4, ft5, ft4            /* ft4 = cosRoll*cosYaw - sinPitch*sinYaw*sinRoll */
+    swc1       ft4, 0x0(a3)             /* m[0][0] = result */
+
+    /* -----------------------------------------
+     * m[0][1] = sinPitch * cosYaw * sinRoll + cosRoll * sinYaw
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, ft3            /* ft4 = sinPitch * cosYaw */
+    mul.s      ft4, fv0                 /* ft4 = sinPitch * cosYaw * sinRoll */
+    mul.s      ft5, fv1, ft2            /* ft5 = cosRoll * sinYaw */
+    add.s      ft4, ft5                 /* ft4 = sinPitch*cosYaw*sinRoll + cosRoll*sinYaw */
+    swc1       ft4, 0x4(a3)             /* m[0][1] = result */
+
+    /* -----------------------------------------
+     * m[0][2] = -sinRoll * cosPitch
+     * ----------------------------------------- */
+    mul.s      ft4, fv0, ft1            /* ft4 = sinRoll * cosPitch */
+    neg.s      ft4                      /* ft4 = -sinRoll * cosPitch */
+    swc1       ft4, 0x8(a3)             /* m[0][2] = result */
+
+    /* -----------------------------------------
+     * m[1][0] = -cosPitch * sinYaw
+     * ----------------------------------------- */
+    mul.s      ft4, ft1, ft2            /* ft4 = cosPitch * sinYaw */
+    neg.s      ft4                      /* ft4 = -cosPitch * sinYaw */
+    swc1       ft4, 0x10(a3)            /* m[1][0] = result */
+
+    /* -----------------------------------------
+     * m[1][1] = cosPitch * cosYaw
+     * ----------------------------------------- */
+    mul.s      ft4, ft1, ft3            /* ft4 = cosPitch * cosYaw */
+    swc1       ft4, 0x14(a3)            /* m[1][1] = result */
+
+    /* -----------------------------------------
+     * m[2][0] = sinPitch * sinYaw * cosRoll + sinRoll * cosYaw
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, ft2            /* ft4 = sinPitch * sinYaw */
+    mul.s      ft4, fv1                 /* ft4 = sinPitch * sinYaw * cosRoll */
+    mul.s      ft5, fv0, ft3            /* ft5 = sinRoll * cosYaw */
+    add.s      ft4, ft5                 /* ft4 = sinPitch*sinYaw*cosRoll + sinRoll*cosYaw */
+    swc1       ft4, 0x20(a3)            /* m[2][0] = result */
+
+    /* -----------------------------------------
+     * m[2][1] = sinRoll * sinYaw - sinPitch * cosYaw * cosRoll
+     * ----------------------------------------- */
+    mul.s      ft4, ft0, ft3            /* ft4 = sinPitch * cosYaw */
+    mul.s      ft4, fv1                 /* ft4 = sinPitch * cosYaw * cosRoll */
+    mul.s      ft5, fv0, ft2            /* ft5 = sinRoll * sinYaw */
+    sub.s      ft4, ft5, ft4            /* ft4 = sinRoll*sinYaw - sinPitch*cosYaw*cosRoll */
+    swc1       ft4, 0x24(a3)            /* m[2][1] = result */
+
+    /* -----------------------------------------
+     * m[2][2] = cosRoll * cosPitch
+     * ----------------------------------------- */
+    mul.s      ft4, fv1, ft1            /* ft4 = cosRoll * cosPitch */
+    swc1       ft4, 0x28(a3)            /* m[2][2] = result */
+
+    /* -----------------------------------------
+     * Load X / Y / Z into fv0, fv1, ft0
+     * ----------------------------------------- */
+    lwc1       fv0, 0xC(a1)             /* fv0 = position.x */
+    lwc1       fv1, 0x10(a1)            /* fv1 = position.y */
+    lwc1       ft0, 0x14(a1)            /* ft0 = position.z */
+
+    /* Compute translation x: tx = m[0][0]*pos.x + m[1][0]*pos.y + m[2][0]*pos.z */
+    lwc1       ft5, 0x0(a3)             /* ft5 = m[0][0] */
+    lwc1       ft4, 0x10(a3)            /* ft4 = m[1][0] */
+    mul.s      ft5, fv0                 /* ft5 = m[0][0] * position.x */
+    mul.s      ft4, fv1                 /* ft4 = m[1][0] * position.y */
+    add.s      ft4, ft5                 /* ft4 = m[0][0]*pos.x + m[1][0]*pos.y */
+    lwc1       ft5, 0x20(a3)            /* ft5 = m[2][0] */
+    mul.s      ft5, ft0                 /* ft5 = m[2][0] * position.z */
+    add.s      ft4, ft5                 /* ft4 = m[0][0]*pos.x + m[1][0]*pos.y + m[2][0]*pos.z */
+    swc1       ft4, 0x30(a3)            /* m[3][0] = translation x */
+
+    /* Compute translation y: ty = m01*pos.x + m11*pos.y + m21*pos.z */
+    lwc1       ft5, 0x4(a3)             /* ft5 = m[0][1] */
+    lwc1       ft4, 0x14(a3)            /* ft4 = m[1][1] */
+    mul.s      ft5, fv0                 /* ft5 = m[0][1] * position.x */
+    mul.s      ft4, fv1                 /* ft4 = m[1][1] * position.y */
+    add.s      ft4, ft5                 /* ft4 = m[0][1]*pos.x + m[1][1]*pos.y */
+    lwc1       ft5, 0x24(a3)            /* ft5 = m[2][1] */
+    mul.s      ft5, ft0                 /* ft5 = m[2][1] * position.z */
+    add.s      ft4, ft5                 /* ft4 = m[0][1]*pos.x + m[1][1]*pos.y + m[2][1]*pos.z */
+    swc1       ft4, 0x34(a3)            /* m[3][1] = translation y */
+
+    /* Compute translation z: tz = m02*pos.x + m12*pos.y + m22*pos.z */
+    lwc1       ft5, 0x8(a3)             /* ft5 = m[0][2] */
+    lwc1       ft4, 0x18(a3)            /* ft4 = m[1][2] */
+    mul.s      ft5, fv0                 /* ft5 = m[0][2] * position.x */
+    mul.s      ft4, fv1                 /* ft4 = m[1][2] * position.y */
+    add.s      ft4, ft5                 /* ft4 = m[0][2]*pos.x + m[1][2]*pos.y */
+    lwc1       ft5, 0x28(a3)            /* ft5 = m[2][2] */
+    mul.s      ft5, ft0                 /* ft5 = m[2][2] * position.z */
+    add.s      ft4, ft5                 /* ft4 = m[0][2]*pos.x + m[1][2]*pos.y + m[2][2]*pos.z */
+    swc1       ft4, 0x38(a3)            /* m[3][2] = translation z */
+
     li.s       ft4, 1.0
-    swc1       ft4, 0x3C(a3)
+    swc1       ft4, 0x3C(a3)            /* m[3][3] = 1.0 */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8
@@ -1600,7 +1748,7 @@ LEAF(tri2d_xz_contains_point)
     sub        t8, t4, t2               /* t8 = C.x - B.x */
     sub        t9, a1, t3               /* t9 = z - B.z */
     MUL        (t7, t8, t9)             /* t7 and t8 = (C.x - B.x) * (z - B.z) */    
-    sub        t6, t6, t7               /* t6 = cross product for edge B->C */
+    sub        t6, t7                   /* t6 = cross product for edge B->C */
     ori        a2, zero, 1              /* a2 = 1 (assume positive) */
     bgez       t6, .edge_bc_positive
     xor        a2, a2                   /* a2 = 0 (cross was negative) */

From 8ed99df684796a0a3e148cb2cdabb3a2a43e6114 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Wed, 10 Dec 2025 15:13:45 -0500
Subject: [PATCH 15/36] Doc func_80070058

---
 src/hasm/ido/math_util.s | 132 +++++++++++++++++++++++++++------------
 1 file changed, 92 insertions(+), 40 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index f68db524c..4a2dee34a 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -1397,50 +1397,102 @@ LEAF(mtxf_from_inverse_transform)
     jr         ra
 END(mtxf_from_inverse_transform)
 
+/**
+ * Incomplete/stripped matrix setup function.
+ *
+ * This function computes normalized sin/cos values for Euler angles (roll, pitch, yaw)
+ * and initializes only the perspective column of a 4×4 matrix. It also computes
+ * several trig products but does not store them, suggesting this is either:
+ *   - Dead/unused code
+ *   - A stripped version of a larger function
+ *   - An inlined fragment that was partially optimized away
+ *
+ * Arguments:
+ *   a0 = pointer to destination 4×4 float matrix (MtxF)
+ *   a1 = pointer to RPYAngles struct:
+ *          0x00: s16 roll
+ *          0x02: s16 pitch
+ *          0x04: s16 yaw
+ *
+ * Effects on matrix:
+ *   m[0][3] = 0.0f
+ *   m[1][3] = 0.0f
+ *   m[2][3] = 0.0f
+ *   m[3][3] = 1.0f
+ *
+ * Register state on exit (computed but unused):
+ *   fv0 = sinRoll,  fv1 = cosRoll
+ *   ft0 = sinPitch, ft1 = cosPitch
+ *   ft2 = sinYaw,   ft3 = cosYaw
+ *   fa0 = sinRoll * cosPitch
+ *   fa1 = cosRoll * cosYaw
+ *   ft4 = sinRoll * sinYaw
+ */
 LEAF(func_80070058)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
 
-    move       a3, a0
-    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
-    lh         a0, 0x0(a1)
-    jal        sins_s16
-    mtc1       v0, fv0
-    cvt.s.w    fv0
-    mul.s      fv0, ft5
-    lh         a0, 0x0(a1)
-    jal        coss_s16
-    mtc1       v0, fv1
-    cvt.s.w    fv1
-    mul.s      fv1, ft5
-    lh         a0, 0x2(a1)
-    jal        sins_s16
-    mtc1       v0, ft0
-    cvt.s.w    ft0
-    mul.s      ft0, ft5
-    lh         a0, 0x2(a1)
-    jal        coss_s16
-    mtc1       v0, ft1
-    cvt.s.w    ft1
-    mul.s      ft1, ft5
-    lh         a0, 0x4(a1)
-    jal        sins_s16
-    mtc1       v0, ft2
-    cvt.s.w    ft2
-    mul.s      ft2, ft5
-    lh         a0, 0x4(a1)
-    jal        coss_s16
-    sw         zero, 0xC(a3)
-    sw         zero, 0x1C(a3)
-    sw         zero, 0x2C(a3)
-    mtc1       v0, ft3
-    cvt.s.w    ft3
-    mul.s      ft3, ft5
-    li.s       ft5, 1.0
-    swc1       ft5, 0x3C(a3)
-    mul.s      fa0, fv0, ft1
-    mul.s      fa1, fv1, ft3
-    mul.s      ft4, fv0, ft2
+    move       a3, a0                   /* a3 = dest matrix pointer */
+    li.s       ft5, 0.0000152587890625  /* ft5 = 1.0f / 0x10000 (s16 to float scale) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for roll (rotation.x)
+     * ----------------------------------------- */
+    lh         a0, 0x0(a1)              /* a0 = roll angle */
+    jal        sins_s16                 /* v0 = sin(roll) as s16 */
+    mtc1       v0, fv0                  /* fv0 = sin(roll) raw bits */
+    cvt.s.w    fv0                      /* fv0 = (float)sin(roll) */
+    mul.s      fv0, ft5                 /* fv0 = sinRoll (normalized) */
+    lh         a0, 0x0(a1)              /* a0 = roll angle */
+    jal        coss_s16                 /* v0 = cos(roll) as s16 */
+    mtc1       v0, fv1                  /* fv1 = cos(roll) raw bits */
+    cvt.s.w    fv1                      /* fv1 = (float)cos(roll) */
+    mul.s      fv1, ft5                 /* fv1 = cosRoll (normalized) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for pitch (rotation.y)
+     * ----------------------------------------- */
+    lh         a0, 0x2(a1)              /* a0 = pitch angle */
+    jal        sins_s16                 /* v0 = sin(pitch) as s16 */
+    mtc1       v0, ft0                  /* ft0 = sin(pitch) raw bits */
+    cvt.s.w    ft0                      /* ft0 = (float)sin(pitch) */
+    mul.s      ft0, ft5                 /* ft0 = sinPitch (normalized) */
+    lh         a0, 0x2(a1)              /* a0 = pitch angle */
+    jal        coss_s16                 /* v0 = cos(pitch) as s16 */
+    mtc1       v0, ft1                  /* ft1 = cos(pitch) raw bits */
+    cvt.s.w    ft1                      /* ft1 = (float)cos(pitch) */
+    mul.s      ft1, ft5                 /* ft1 = cosPitch (normalized) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for yaw (rotation.z)
+     * ----------------------------------------- */
+    lh         a0, 0x4(a1)              /* a0 = yaw angle */
+    jal        sins_s16                 /* v0 = sin(yaw) as s16 */
+    mtc1       v0, ft2                  /* ft2 = sin(yaw) raw bits */
+    cvt.s.w    ft2                      /* ft2 = (float)sin(yaw) */
+    mul.s      ft2, ft5                 /* ft2 = sinYaw (normalized) */
+    lh         a0, 0x4(a1)              /* a0 = yaw angle */
+    jal        coss_s16                 /* v0 = cos(yaw) as s16 */
+    mtc1       v0, ft3                  /* ft3 = cos(yaw) raw bits */
+    cvt.s.w    ft3                      /* ft3 = (float)cos(yaw) */
+    mul.s      ft3, ft5                 /* ft3 = cosYaw (normalized) */
+
+    /* -----------------------------------------
+     * Compute trig products (unused - no stores)
+     * These would typically be used for rotation matrix elements
+     * ----------------------------------------- */
+    mul.s      fa0, fv0, ft1            /* fa0 = sinRoll * cosPitch */
+    mul.s      fa1, fv1, ft3            /* fa1 = cosRoll * cosYaw */
+    mul.s      ft4, fv0, ft2            /* ft4 = sinRoll * sinYaw */
+
+    /* -----------------------------------------
+     * Initialize perspective column (interleaved with yaw cos)
+     * ----------------------------------------- */
+    li.s       ft5, 1.0                 /* ft5 = 1.0f */
+    sw         zero, 0xC(a3)            /* m[0][3] = 0.0f */
+    sw         zero, 0x1C(a3)           /* m[1][3] = 0.0f */
+    sw         zero, 0x2C(a3)           /* m[2][3] = 0.0f */
+    swc1       ft5, 0x3C(a3)            /* m[3][3] = 1.0f */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8

From 1d336687eba458b5d19b58dac06bcb5a0500c616 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Wed, 10 Dec 2025 16:00:10 -0500
Subject: [PATCH 16/36] Doc mtxf_billboard

---
 src/hasm/ido/math_util.s | 114 ++++++++++++++++++++++++++-------------
 1 file changed, 77 insertions(+), 37 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 4a2dee34a..8fce712ad 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -1486,7 +1486,7 @@ LEAF(func_80070058)
     mul.s      ft4, fv0, ft2            /* ft4 = sinRoll * sinYaw */
 
     /* -----------------------------------------
-     * Initialize perspective column (interleaved with yaw cos)
+     * Initialize perspective column
      * ----------------------------------------- */
     li.s       ft5, 1.0                 /* ft5 = 1.0f */
     sw         zero, 0xC(a3)            /* m[0][3] = 0.0f */
@@ -1499,46 +1499,86 @@ LEAF(func_80070058)
     jr         ra
 END(func_80070058)
 
+/**
+ * Builds a billboard matrix for a sprite that always faces the camera.
+ *
+ * The resulting 4×4 matrix applies a rotation around the Z axis (in the XY plane),
+ * followed by non-uniform scaling (uniform in X/Z and scaled by scaleY in Y).
+ *
+ * This is commonly used to render flat sprites that rotate to face the camera
+ * while preserving their upright orientation.
+ *
+ * Arguments:
+ *   a0 = pointer to destination 4×4 float matrix (MtxF)
+ *   a1 = rotation angle (s16, around the view axis / Z rotation)
+ *   a2 = scale (passed as raw float bits in integer register)
+ *   a3 = scaleY (passed as raw float bits in integer register, for non-uniform Y scaling)
+ *
+ * The resulting matrix:
+ *   - Rotates around the Z axis by the given angle
+ *   - Applies uniform scale to X axis
+ *   - Applies scaleY to Y axis (allows stretching/squashing)
+ *   - Z axis uses the base scale value
+ *   - Translation is zeroed (caller must set position separately)
+ *
+ * Matrix layout:
+ *   [ cos*scale    sin*scale           0       0 ]
+ *   [ -sin*scale   cos*scale*scaleY    0       0 ]
+ *   [ 0            0                   scale   0 ]
+ *   [ 0            0                   0       1 ]
+ */
 LEAF(mtxf_billboard)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
 
-    move       t9, a3
-    move       a3, a0
-    li.s       ft5, 0.0000152587890625 /* (1.0f / 0x10000) */
-    move       a0, a1
-    jal        sins_s16
-    mtc1       v0, ft2
-    move       a0, a1
-    cvt.s.w    ft2
-    mul.s      ft2, ft5
-    jal        coss_s16
-    mtc1       v0, ft3
-    mtc1       a2, ft4
-    cvt.s.w    ft3
-    sw         zero, 0x8(a3)
-    sw         zero, 0xC(a3)
-    sw         zero, 0x18(a3)
-    sw         zero, 0x1C(a3)
-    swc1       ft4, 0x28(a3)
-    mul.s      ft3, ft5
-    mtc1       t9, ft5
-    sw         zero, 0x20(a3)
-    sw         zero, 0x24(a3)
-    sw         zero, 0x2C(a3)
-    sw         zero, 0x30(a3)
-    sw         zero, 0x34(a3)
-    sw         zero, 0x38(a3)
-    mul.s      ft3, ft4
-    mul.s      ft2, ft4
-    li.s       ft4, 1.0
-    swc1       ft3, 0x0(a3)
-    swc1       ft2, 0x4(a3)
-    swc1       ft4, 0x3C(a3)
-    mul.s      ft3, ft5
-    neg.s      ft2, ft2
-    swc1       ft2, 0x10(a3)
-    swc1       ft3, 0x14(a3)
+    move       t9, a3                   /* t9 = scaleY (save before a3 is overwritten) */
+    move       a3, a0                   /* a3 = dest matrix pointer */
+    li.s       ft5, 0.0000152587890625  /* ft5 = 1.0f / 0x10000 (s16 to float scale) */
+
+    /* -----------------------------------------
+     * Compute sin/cos for rotation angle
+     * ----------------------------------------- */
+    move       a0, a1                   /* a0 = rotation angle */
+    jal        sins_s16                 /* v0 = sin(angle) as s16 */
+    mtc1       v0, ft2                  /* ft2 = sin(angle) raw bits */
+    cvt.s.w    ft2                      /* ft2 = (float)sin(angle) */
+    mul.s      ft2, ft5                 /* ft2 = sinAngle (normalized) */
+
+    move       a0, a1                   /* a0 = rotation angle */
+    jal        coss_s16                 /* v0 = cos(angle) as s16 */
+    mtc1       v0, ft3                  /* ft3 = cos(angle) raw bits */
+    cvt.s.w    ft3                      /* ft3 = (float)cos(angle) */
+    mul.s      ft3, ft5                 /* ft3 = cosAngle (normalized) */
+
+    /* -----------------------------------------
+     * Build billboard matrix
+     * ----------------------------------------- */
+    mtc1       a2, ft4                  /* ft4 = scale */
+    mtc1       t9, ft5                  /* ft5 = scaleY */
+    mul.s      ft3, ft4                 /* ft3 = cos * scale */
+    mul.s      ft2, ft4                 /* ft2 = sin * scale */
+
+    sw         zero, 0x8(a3)            /* m[0][2] = 0.0 */
+    sw         zero, 0xC(a3)            /* m[0][3] = 0.0 */
+    sw         zero, 0x18(a3)           /* m[1][2] = 0.0 */
+    sw         zero, 0x1C(a3)           /* m[1][3] = 0.0 */
+    sw         zero, 0x20(a3)           /* m[2][0] = 0.0 */
+    sw         zero, 0x24(a3)           /* m[2][1] = 0.0 */
+    sw         zero, 0x2C(a3)           /* m[2][3] = 0.0 */
+    sw         zero, 0x30(a3)           /* m[3][0] = 0.0 */
+    sw         zero, 0x34(a3)           /* m[3][1] = 0.0 */
+    sw         zero, 0x38(a3)           /* m[3][2] = 0.0 */
+    swc1       ft3, 0x0(a3)             /* m[0][0] = cos * scale */
+    swc1       ft2, 0x4(a3)             /* m[0][1] = sin * scale */
+    swc1       ft4, 0x28(a3)            /* m[2][2] = scale */
+
+    mul.s      ft3, ft5                 /* ft3 = cos * scale * scaleY */
+    neg.s      ft2                      /* ft2 = -(sin * scale) */
+    li.s       ft4, 1.0                 /* ft4 = 1.0f */
+
+    swc1       ft2, 0x10(a3)            /* m[1][0] = -(sin * scale) */
+    swc1       ft3, 0x14(a3)            /* m[1][1] = cos * scale * scaleY */
+    swc1       ft4, 0x3C(a3)            /* m[3][3] = 1.0 */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8

From 975780ec6f9f5782023fb3a89a255641b11bf469 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 09:24:24 -0500
Subject: [PATCH 17/36] Doc vec3f_rotate

---
 src/hasm/ido/math_util.s | 125 +++++++++++++++++++++++++++------------
 1 file changed, 87 insertions(+), 38 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 8fce712ad..ee2e0002f 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -1656,48 +1656,97 @@ LEAF(vec3s_rotate_rpy)
     jr         ra
 END(vec3s_rotate_rpy)
 
-/* Official Name: mathOneFloatRPY */
+/**
+ * Rotates a 3D floating-point vector by Euler angles in RPY (Roll-Pitch-Yaw) order.
+ *
+ * Official Name: mathOneFloatRPY
+ *
+ * The rotation is applied in the order: Yaw (Z) -> Pitch (Y) -> Roll (X)
+ * Each rotation is a 2D rotation in the corresponding plane.
+ *
+ * Arguments:
+ *   a0 = pointer to Vec3s rotation angles:
+ *          0x00: s16 roll  (rotation around X axis)
+ *          0x02: s16 pitch (rotation around Y axis)
+ *          0x04: s16 yaw   (rotation around Z axis)
+ *   a1 = pointer to Vec3f vector (in/out):
+ *          0x00: f32 x
+ *          0x04: f32 y
+ *          0x08: f32 z
+ *
+ * Math:
+ *   First apply yaw (Z rotation):
+ *     x1 = x * cos(yaw) - y * sin(yaw)
+ *     y1 = y * cos(yaw) + x * sin(yaw)
+ *   Then apply pitch (Y rotation):
+ *     y2 = y1 * cos(pitch) - z * sin(pitch)
+ *     z1  = z * cos(pitch) + y1 * sin(pitch)
+ *   Finally apply roll (X rotation):
+ *     x2 = x1 * cos(roll) + z1 * sin(roll)
+ *     z2 = z1 * cos(roll) - x1 * sin(roll)
+ */
 LEAF(vec3f_rotate)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
+    move       a2, a0                   /* a2 = rotation angles pointer */
 
-    lwc1       ft0, 0x0(a1)
-    lwc1       ft1, 0x4(a1)
-    lwc1       ft2, 0x8(a1)
-    move       a2, a0
-    lh         a0, 0x4(a2)
-    jal        sins_f
-    mul.s      ft3, ft0, fv0
-    mul.s      fa0, ft1, fv0
-    lh         a0, 0x4(a2)
-    jal        coss_f
-    mul.s      ft0, fv0
-    lh         a0, 0x2(a2)
-    mul.s      ft1, fv0
-    sub.s      ft0, fa0
-    add.s      ft1, ft3
-    jal        sins_f
-    mul.s      ft3, ft1, fv0
-    mul.s      fa0, ft2, fv0
-    lh         a0, 0x2(a2)
-    jal        coss_f
-    mul.s      ft1, fv0
-    lh         a0, 0x0(a2)
-    mul.s      ft2, fv0
-    sub.s      ft1, fa0
-    add.s      ft2, ft3
-    jal        sins_f
-    mul.s      ft3, ft0, fv0
-    mul.s      fa0, ft2, fv0
-    lh         a0, 0x0(a2)
-    jal        coss_f
-    mul.s      ft0, fv0
-    swc1       ft1, 0x4(a1)
-    mul.s      ft2, fv0
-    add.s      ft0, fa0
-    sub.s      ft2, ft3
-    swc1       ft0, 0x0(a1)
-    swc1       ft2, 0x8(a1)
+    /* Load input vector components */
+    lwc1       ft0, 0x0(a1)             /* ft0 = x */
+    lwc1       ft1, 0x4(a1)             /* ft1 = y */
+    lwc1       ft2, 0x8(a1)             /* ft2 = z */
+
+    /* -----------------------------------------
+     * Apply yaw rotation (around Z axis)
+     * x1 = x*cos - y*sin
+     * y1 = y*cos + x*sin
+     * ----------------------------------------- */
+    lh         a0, 0x4(a2)              /* a0 = yaw angle */
+    jal        sins_f                   /* fv0 = sin(yaw) */
+    mul.s      ft3, ft0, fv0            /* ft3 = x * sin(yaw) */
+    mul.s      fa0, ft1, fv0            /* fa0 = y * sin(yaw) */
+    lh         a0, 0x4(a2)              /* a0 = yaw angle */
+    jal        coss_f                   /* fv0 = cos(yaw) */
+    mul.s      ft0, ft0, fv0            /* ft0 = x * cos(yaw) */
+    sub.s      ft0, ft0, fa0            /* ft0 = x1 = x*cos - y*sin */
+    mul.s      ft1, ft1, fv0            /* ft1 = y * cos(yaw) */
+    add.s      ft1, ft1, ft3            /* ft1 = y1 = y*cos + x*sin */
+
+    /* -----------------------------------------
+     * Apply pitch rotation (around Y axis)
+     * y2 = y1*cos - z*sin
+     * z1 = z*cos + y1*sin
+     * ----------------------------------------- */
+    lh         a0, 0x2(a2)              /* a0 = pitch angle */
+    jal        sins_f                   /* fv0 = sin(pitch) */
+    mul.s      ft3, ft1, fv0            /* ft3 = y1 * sin(pitch) */
+    mul.s      fa0, ft2, fv0            /* fa0 = z * sin(pitch) */
+    lh         a0, 0x2(a2)              /* a0 = pitch angle */
+    jal        coss_f                   /* fv0 = cos(pitch) */
+    mul.s      ft1, ft1, fv0            /* ft1 = y1 * cos(pitch) */
+    sub.s      ft1, ft1, fa0            /* ft1 = y2 = y1*cos - z*sin */
+    mul.s      ft2, ft2, fv0            /* ft2 = z * cos(pitch) */
+    add.s      ft2, ft2, ft3            /* ft2 = z1 = z*cos + y1*sin */
+
+    /* -----------------------------------------
+     * Apply roll rotation (around X axis)
+     * x2 = x1*cos + z1*sin
+     * z2 = z1*cos - x1*sin
+     * ----------------------------------------- */
+    lh         a0, 0x0(a2)              /* a0 = roll angle */
+    jal        sins_f                   /* fv0 = sin(roll) */
+    mul.s      ft3, ft0, fv0            /* ft3 = x1 * sin(roll) */
+    mul.s      fa0, ft2, fv0            /* fa0 = z1 * sin(roll) */
+    lh         a0, 0x0(a2)              /* a0 = roll angle */
+    jal        coss_f                   /* fv0 = cos(roll) */
+    mul.s      ft0, ft0, fv0            /* ft0 = x1 * cos(roll) */
+    add.s      ft0, ft0, fa0            /* ft0 = x2 = x1*cos + z1*sin */
+    mul.s      ft2, ft2, fv0            /* ft2 = z1 * cos(roll) */
+    sub.s      ft2, ft2, ft3            /* ft2 = z2 = z1*cos - x1*sin */
+
+    /* Store rotated vector */
+    swc1       ft0, 0x0(a1)             /* store x2 */
+    swc1       ft1, 0x4(a1)             /* store y2 */
+    swc1       ft2, 0x8(a1)             /* store z2 */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8

From 8cbd4fd52bc6c713aaa175788d56902f59a2a335 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 11:14:39 -0500
Subject: [PATCH 18/36] Doc vec3f_rotate_ypr

---
 src/hasm/ido/math_util.s | 149 ++++++++++++++++++++++++++-------------
 1 file changed, 99 insertions(+), 50 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index ee2e0002f..a7189760c 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -1706,10 +1706,10 @@ LEAF(vec3f_rotate)
     mul.s      fa0, ft1, fv0            /* fa0 = y * sin(yaw) */
     lh         a0, 0x4(a2)              /* a0 = yaw angle */
     jal        coss_f                   /* fv0 = cos(yaw) */
-    mul.s      ft0, ft0, fv0            /* ft0 = x * cos(yaw) */
-    sub.s      ft0, ft0, fa0            /* ft0 = x1 = x*cos - y*sin */
-    mul.s      ft1, ft1, fv0            /* ft1 = y * cos(yaw) */
-    add.s      ft1, ft1, ft3            /* ft1 = y1 = y*cos + x*sin */
+    mul.s      ft0, fv0                 /* ft0 = x * cos(yaw) */
+    sub.s      ft0, fa0                 /* ft0 = x1 = x*cos - y*sin */
+    mul.s      ft1, fv0                 /* ft1 = y * cos(yaw) */
+    add.s      ft1, ft3                 /* ft1 = y1 = y*cos + x*sin */
 
     /* -----------------------------------------
      * Apply pitch rotation (around Y axis)
@@ -1722,10 +1722,10 @@ LEAF(vec3f_rotate)
     mul.s      fa0, ft2, fv0            /* fa0 = z * sin(pitch) */
     lh         a0, 0x2(a2)              /* a0 = pitch angle */
     jal        coss_f                   /* fv0 = cos(pitch) */
-    mul.s      ft1, ft1, fv0            /* ft1 = y1 * cos(pitch) */
-    sub.s      ft1, ft1, fa0            /* ft1 = y2 = y1*cos - z*sin */
-    mul.s      ft2, ft2, fv0            /* ft2 = z * cos(pitch) */
-    add.s      ft2, ft2, ft3            /* ft2 = z1 = z*cos + y1*sin */
+    mul.s      ft1, fv0                 /* ft1 = y1 * cos(pitch) */
+    sub.s      ft1, fa0                 /* ft1 = y2 = y1*cos - z*sin */
+    mul.s      ft2, fv0                 /* ft2 = z * cos(pitch) */
+    add.s      ft2, ft3                 /* ft2 = z1 = z*cos + y1*sin */
 
     /* -----------------------------------------
      * Apply roll rotation (around X axis)
@@ -1738,10 +1738,10 @@ LEAF(vec3f_rotate)
     mul.s      fa0, ft2, fv0            /* fa0 = z1 * sin(roll) */
     lh         a0, 0x0(a2)              /* a0 = roll angle */
     jal        coss_f                   /* fv0 = cos(roll) */
-    mul.s      ft0, ft0, fv0            /* ft0 = x1 * cos(roll) */
-    add.s      ft0, ft0, fa0            /* ft0 = x2 = x1*cos + z1*sin */
-    mul.s      ft2, ft2, fv0            /* ft2 = z1 * cos(roll) */
-    sub.s      ft2, ft2, ft3            /* ft2 = z2 = z1*cos - x1*sin */
+    mul.s      ft0, fv0                 /* ft0 = x1 * cos(roll) */
+    add.s      ft0, fa0                 /* ft0 = x2 = x1*cos + z1*sin */
+    mul.s      ft2, fv0                 /* ft2 = z1 * cos(roll) */
+    sub.s      ft2, ft3                 /* ft2 = z2 = z1*cos - x1*sin */
 
     /* Store rotated vector */
     swc1       ft0, 0x0(a1)             /* store x2 */
@@ -1753,48 +1753,97 @@ LEAF(vec3f_rotate)
     jr         ra
 END(vec3f_rotate)
 
-/* Official Name: mathOneFloatYPR */
+/**
+ * Rotates a 3D floating-point vector by Euler angles in YPR (Yaw-Pitch-Roll) order.
+ *
+ * Official Name: mathOneFloatYPR
+ *
+ * The rotation is applied in the order: Roll (X) -> Pitch (Y) -> Yaw (Z)
+ * This is the reverse application order compared to vec3f_rotate (RPY).
+ *
+ * Arguments:
+ *   a0 = pointer to Vec3s rotation angles:
+ *          0x00: s16 roll  (rotation around X axis)
+ *          0x02: s16 pitch (rotation around Y axis)
+ *          0x04: s16 yaw   (rotation around Z axis)
+ *   a1 = pointer to Vec3f vector (in/out):
+ *          0x00: f32 x
+ *          0x04: f32 y
+ *          0x08: f32 z
+ *
+ * Math:
+ *   First apply roll (X rotation):
+ *     x1 = x * cos(roll) + z * sin(roll)
+ *     z1 = z * cos(roll) - x * sin(roll)
+ *   Then apply pitch (Y rotation):
+ *     y1 = y * cos(pitch) - z1 * sin(pitch)
+ *     z2 = z1 * cos(pitch) + y * sin(pitch)
+ *   Finally apply yaw (Z rotation):
+ *     x2 = x1 * cos(yaw) - y1 * sin(yaw)
+ *     y2 = y1 * cos(yaw) + x1 * sin(yaw)
+ */
 LEAF(vec3f_rotate_ypr)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
+    move       a2, a0                   /* a2 = rotation angles pointer */
 
-    lwc1       ft0, 0x0(a1)
-    lwc1       ft1, 0x4(a1)
-    lwc1       ft2, 0x8(a1)
-    move       a2, a0
-    lh         a0, 0x0(a2)
-    jal        sins_f
-    mul.s      ft3, ft0, fv0
-    mul.s      fa0, ft2, fv0
-    lh         a0, 0x0(a2)
-    jal        coss_f
-    mul.s      ft0, fv0
-    lh         a0, 0x2(a2)
-    mul.s      ft2, fv0
-    add.s      ft0, fa0
-    sub.s      ft2, ft3
-    jal        sins_f
-    mul.s      ft3, ft1, fv0
-    mul.s      fa0, ft2, fv0
-    lh         a0, 0x2(a2)
-    jal        coss_f
-    mul.s      ft1, fv0
-    lh         a0, 0x4(a2)
-    mul.s      ft2, fv0
-    sub.s      ft1, fa0
-    add.s      ft2, ft3
-    jal        sins_f
-    mul.s      ft3, ft0, fv0
-    mul.s      fa0, ft1, fv0
-    lh         a0, 0x4(a2)
-    jal        coss_f
-    mul.s      ft0, fv0
-    swc1       ft2, 0x8(a1)
-    mul.s      ft1, fv0
-    sub.s      ft0, fa0
-    add.s      ft1, ft3
-    swc1       ft0, 0x0(a1)
-    swc1       ft1, 0x4(a1)
+    /* Load input vector components */
+    lwc1       ft0, 0x0(a1)             /* ft0 = x */
+    lwc1       ft1, 0x4(a1)             /* ft1 = y */
+    lwc1       ft2, 0x8(a1)             /* ft2 = z */
+
+    /* -----------------------------------------
+     * Apply roll rotation (around X axis)
+     * x1 = x*cos + z*sin
+     * z1 = z*cos - x*sin
+     * ----------------------------------------- */
+    lh         a0, 0x0(a2)              /* a0 = roll angle */
+    jal        sins_f                   /* fv0 = sin(roll) */
+    mul.s      ft3, ft0, fv0            /* ft3 = x * sin(roll) */
+    mul.s      fa0, ft2, fv0            /* fa0 = z * sin(roll) */
+    lh         a0, 0x0(a2)              /* a0 = roll angle */
+    jal        coss_f                   /* fv0 = cos(roll) */
+    mul.s      ft0, fv0                 /* ft0 = x * cos(roll) */
+    add.s      ft0, fa0                 /* ft0 = x1 = x*cos + z*sin */
+    mul.s      ft2, fv0                 /* ft2 = z * cos(roll) */
+    sub.s      ft2, ft3                 /* ft2 = z1 = z*cos - x*sin */
+
+    /* -----------------------------------------
+     * Apply pitch rotation (around Y axis)
+     * y1 = y*cos - z1*sin
+     * z2 = z1*cos + y*sin
+     * ----------------------------------------- */
+    lh         a0, 0x2(a2)              /* a0 = pitch angle */
+    jal        sins_f                   /* fv0 = sin(pitch) */
+    mul.s      ft3, ft1, fv0            /* ft3 = y * sin(pitch) */
+    mul.s      fa0, ft2, fv0            /* fa0 = z1 * sin(pitch) */
+    lh         a0, 0x2(a2)              /* a0 = pitch angle */
+    jal        coss_f                   /* fv0 = cos(pitch) */
+    mul.s      ft1, fv0                 /* ft1 = y * cos(pitch) */
+    sub.s      ft1, fa0                 /* ft1 = y1 = y*cos - z1*sin */
+    mul.s      ft2, fv0                 /* ft2 = z1 * cos(pitch) */
+    add.s      ft2, ft3                 /* ft2 = z2 = z1*cos + y*sin */
+
+    /* -----------------------------------------
+     * Apply yaw rotation (around Z axis)
+     * x2 = x1*cos - y1*sin
+     * y2 = y1*cos + x1*sin
+     * ----------------------------------------- */
+    lh         a0, 0x4(a2)              /* a0 = yaw angle */
+    jal        sins_f                   /* fv0 = sin(yaw) */
+    mul.s      ft3, ft0, fv0            /* ft3 = x1 * sin(yaw) */
+    mul.s      fa0, ft1, fv0            /* fa0 = y1 * sin(yaw) */
+    lh         a0, 0x4(a2)              /* a0 = yaw angle */
+    jal        coss_f                   /* fv0 = cos(yaw) */
+    mul.s      ft0, fv0                 /* ft0 = x1 * cos(yaw) */
+    sub.s      ft0, fa0                 /* ft0 = x2 = x1*cos - y1*sin */
+    mul.s      ft1, fv0                 /* ft1 = y1 * cos(yaw) */
+    add.s      ft1, ft3                 /* ft1 = y2 = y1*cos + x1*sin */
+
+    /* Store rotated vector */
+    swc1       ft0, 0x0(a1)             /* store x2 */
+    swc1       ft1, 0x4(a1)             /* store y2 */
+    swc1       ft2, 0x8(a1)             /* store z2 */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8

From 87cc91f372486eec022e817c7d524d406781cad0 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 11:32:36 -0500
Subject: [PATCH 19/36] Doc vec3f_rotate_py

---
 src/hasm/ido/math_util.s | 82 ++++++++++++++++++++++++++++++----------
 src/hasm/math_util.c     |  4 +-
 2 files changed, 65 insertions(+), 21 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index a7189760c..a201bf07a 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -1850,29 +1850,73 @@ LEAF(vec3f_rotate_ypr)
     jr         ra
 END(vec3f_rotate_ypr)
 
-/* Official Name: mathOneFloatPY */
+/**
+ * Rotates a 3D floating-point vector by Pitch and Yaw angles only.
+ *
+ * Official Name: mathOneFloatPY
+ *
+ * This is a simplified rotation function that only uses the Z input component
+ * to generate a direction vector based on pitch and yaw angles. The input X and Y
+ * components are ignored.
+ *
+ * Arguments:
+ *   a0 = pointer to Vec3s rotation angles:
+ *          0x00: s16 roll  (rotation around X axis) - used for final X/Z split
+ *          0x02: s16 pitch (rotation around Y axis) - controls Y component
+ *          0x04: s16 yaw   (unused in this function)
+ *   a1 = pointer to Vec3f vector (in/out):
+ *          0x00: f32 x (output only)
+ *          0x04: f32 y (output only)
+ *          0x08: f32 z (input: magnitude, output: transformed z)
+ *
+ * Math:
+ *   First apply pitch (Y rotation) to get Y component:
+ *     y = -(z * sin(pitch))
+ *     z1 = z * cos(pitch)
+ *   Then apply roll to split z1 into X and Z:
+ *     x = z1 * sin(roll)
+ *     z2 = z1 * cos(roll)
+ *
+ * This effectively converts a Z-magnitude into a direction vector based on
+ * pitch and roll angles, useful for aiming or facing direction calculations.
+ */
 LEAF(vec3f_rotate_py)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
+    move       a2, a0                   /* a2 = rotation angles pointer */
 
-    move       a2, a0
-    lwc1       ft2, 0x8(a1)
-    lh         a0, 0x2(a2)
-    jal        sins_f
-    mul.s      ft1, ft2, fv0
-    lh         a0, 0x2(a2)
-    jal        coss_f
-    neg.s      ft1
-    mul.s      ft2, fv0
-    lh         a0, 0x0(a2)
-    jal        sins_f
-    mul.s      ft0, ft2, fv0
-    lh         a0, 0x0(a2)
-    jal        coss_f
-    mul.s      ft2, fv0
-    swc1       ft0, 0x0(a1)
-    swc1       ft1, 0x4(a1)
-    swc1       ft2, 0x8(a1)
+    /* Load input Z component (used as magnitude) */
+    lwc1       ft2, 0x8(a1)             /* ft2 = z (input magnitude) */
+
+    /* -----------------------------------------
+     * Apply pitch rotation (around Y axis)
+     * y = -z * sin(pitch)
+     * z1 = z * cos(pitch)
+     * ----------------------------------------- */
+    lh         a0, 0x2(a2)              /* a0 = pitch angle */
+    jal        sins_f                   /* fv0 = sin(pitch) */
+    mul.s      ft1, ft2, fv0            /* ft1 = z * sin(pitch) */
+    lh         a0, 0x2(a2)              /* a0 = pitch angle */
+    jal        coss_f                   /* fv0 = cos(pitch) */
+    neg.s      ft1                      /* ft1 = y = -z * sin(pitch) */
+    mul.s      ft2, fv0                 /* ft2 = z1 = z * cos(pitch) */
+
+    /* -----------------------------------------
+     * Apply roll rotation to split z1 into X and Z
+     * x = z1 * sin(roll)
+     * z2 = z1 * cos(roll)
+     * ----------------------------------------- */
+    lh         a0, 0x0(a2)              /* a0 = roll angle */
+    jal        sins_f                   /* fv0 = sin(roll) */
+    mul.s      ft0, ft2, fv0            /* ft0 = x = z1 * sin(roll) */
+    lh         a0, 0x0(a2)              /* a0 = roll angle */
+    jal        coss_f                   /* fv0 = cos(roll) */
+    mul.s      ft2, fv0                 /* ft2 = z2 = z1 * cos(roll) */
+
+    /* Store output direction vector */
+    swc1       ft0, 0x0(a1)             /* store x */
+    swc1       ft1, 0x4(a1)             /* store y */
+    swc1       ft2, 0x8(a1)             /* store z */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8
diff --git a/src/hasm/math_util.c b/src/hasm/math_util.c
index df2b55398..3eab96feb 100644
--- a/src/hasm/math_util.c
+++ b/src/hasm/math_util.c
@@ -645,8 +645,8 @@ void vec3f_rotate_py(Vec3s *rotation, Vec3f *vec) {
 
     z = vec->z;
 
-    vec->x = z * cosX * sinY;
-    vec->y = -z * sinX;
+    vec->x = z * cosY * sinX;
+    vec->y = -z * sinY;
     vec->z = z * cosX * cosY;
 }
 #else

From 49dc753b6f6025d22b67ac00a034a5b3fff796a3 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 11:42:19 -0500
Subject: [PATCH 20/36] Doc mtxf_from_translation

---
 src/hasm/ido/math_util.s | 63 +++++++++++++++++++++++++++++-----------
 1 file changed, 46 insertions(+), 17 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index a201bf07a..40fa712c2 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2014,27 +2014,56 @@ LEAF(tri2d_xz_contains_point)
     jr         ra
 END(tri2d_xz_contains_point)
 
-/* Official Name: mathTranslateMtx */
+/**
+ * Creates a 4×4 translation matrix from X, Y, Z coordinates.
+ *
+ * Official Name: mathTranslateMtx
+ *
+ * The resulting matrix is an identity matrix with the translation
+ * components set in the bottom row (row 3).
+ *
+ * Arguments:
+ *   a0 = pointer to destination 4×4 float matrix (MtxF)
+ *   a1 = x translation (passed as raw float bits in integer register)
+ *   a2 = y translation (passed as raw float bits in integer register)
+ *   a3 = z translation (passed as raw float bits in integer register)
+ *
+ * Resulting matrix:
+ *   [ 1  0  0  0 ]
+ *   [ 0  1  0  0 ]
+ *   [ 0  0  1  0 ]
+ *   [ x  y  z  1 ]
+ */
 LEAF(mtxf_from_translation)
-    /* Clear matrix */
-    move       t0, a0
-    addiu      t1, t0, 0x40
-    .L80070600:
-    sw         zero, 0(t0)
-    addiu      t0, 4
-    bne        t1, t0, .L80070600
+    /* -----------------------------------------
+     * Clear entire 64-byte matrix to zero
+     * ----------------------------------------- */
+    move       t0, a0                   /* t0 = current write pointer */
+    addiu      t1, t0, 0x40             /* t1 = end pointer (64 bytes) */
 
+.mtxf_from_translation_clear_loop:
+    sw         zero, 0(t0)              /* clear 4 bytes */
+    addiu      t0, 4                    /* advance pointer */
+    bne        t1, t0, .mtxf_from_translation_clear_loop
+
+    /* -----------------------------------------
+     * Set diagonal elements to 1.0 (identity)
+     * ----------------------------------------- */
+    li.s       ft5, 1.0                 /* ft5 = 1.0f */
     .set noreorder
-    li.s       ft5, 1.0
-    nop
+    swc1       ft5, 0x0(a0)             /* m[0][0] = 1.0 */
+    swc1       ft5, 0x14(a0)            /* m[1][1] = 1.0 */
+    swc1       ft5, 0x28(a0)            /* m[2][2] = 1.0 */
+    swc1       ft5, 0x3C(a0)            /* m[3][3] = 1.0 */
+
+    /* -----------------------------------------
+     * Set translation components (row 3)
+     * ----------------------------------------- */
+    sw         a1, 0x30(a0)             /* m[3][0] = x */
+    sw         a2, 0x34(a0)             /* m[3][1] = y */
     .set reorder
-    swc1       ft5, 0x0(a0)
-    swc1       ft5, 0x14(a0)
-    swc1       ft5, 0x28(a0)
-    swc1       ft5, 0x3C(a0)
-    sw         a1, 0x30(a0)
-    sw         a2, 0x34(a0)
-    sw         a3, 0x38(a0)
+    sw         a3, 0x38(a0)             /* m[3][2] = z */
+
     jr         ra
 END(mtxf_from_translation)
 

From 6332bb52244eb125523f20127e41392f998441d9 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 12:04:52 -0500
Subject: [PATCH 21/36] Doc mtxf_from_scale

---
 src/hasm/ido/math_util.s | 57 +++++++++++++++++++++++++---------------
 1 file changed, 36 insertions(+), 21 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 40fa712c2..c470a9dc0 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2046,19 +2046,12 @@ LEAF(mtxf_from_translation)
     addiu      t0, 4                    /* advance pointer */
     bne        t1, t0, .mtxf_from_translation_clear_loop
 
-    /* -----------------------------------------
-     * Set diagonal elements to 1.0 (identity)
-     * ----------------------------------------- */
     li.s       ft5, 1.0                 /* ft5 = 1.0f */
     .set noreorder
     swc1       ft5, 0x0(a0)             /* m[0][0] = 1.0 */
     swc1       ft5, 0x14(a0)            /* m[1][1] = 1.0 */
     swc1       ft5, 0x28(a0)            /* m[2][2] = 1.0 */
     swc1       ft5, 0x3C(a0)            /* m[3][3] = 1.0 */
-
-    /* -----------------------------------------
-     * Set translation components (row 3)
-     * ----------------------------------------- */
     sw         a1, 0x30(a0)             /* m[3][0] = x */
     sw         a2, 0x34(a0)             /* m[3][1] = y */
     .set reorder
@@ -2067,24 +2060,46 @@ LEAF(mtxf_from_translation)
     jr         ra
 END(mtxf_from_translation)
 
-/* Official Name: mathScaleMtx */
+/**
+ * Creates a 4×4 scaling matrix from X, Y, Z scale factors.
+ *
+ * Official Name: mathScaleMtx
+ *
+ * The resulting matrix is a zero matrix with the scale factors
+ * set on the diagonal and 1.0 in the homogeneous coordinate.
+ *
+ * Arguments:
+ *   a0 = pointer to destination 4×4 float matrix (MtxF)
+ *   a1 = x scale (passed as raw float bits in integer register)
+ *   a2 = y scale (passed as raw float bits in integer register)
+ *   a3 = z scale (passed as raw float bits in integer register)
+ *
+ * Resulting matrix:
+ *   [ scaleX  0       0       0 ]
+ *   [ 0       scaleY  0       0 ]
+ *   [ 0       0       scaleZ  0 ]
+ *   [ 0       0       0       1 ]
+ */
 LEAF(mtxf_from_scale)
-    /* Clear matrix */
-    move       t0, a0
-    addiu      t1, t0, 0x40
-    .L80070640:
-    sw         zero, 0(t0)
-    addiu      t0, 4
-    bne        t1, t0, .L80070640
+    /* -----------------------------------------
+     * Clear entire 64-byte matrix to zero
+     * ----------------------------------------- */
+    move       t0, a0                   /* t0 = current write pointer */
+    addiu      t1, t0, 0x40             /* t1 = end pointer (64 bytes) */
 
+.mtxf_from_scale_clear_loop:
+    sw         zero, 0(t0)              /* clear 4 bytes */
+    addiu      t0, 4                    /* advance pointer */
+    bne        t1, t0, .mtxf_from_scale_clear_loop
+
+    li.s       ft5, 1.0                 /* ft5 = 1.0f */
+    swc1       ft5, 0x3C(a0)            /* m[3][3] = 1.0 */
     .set noreorder
-    li.s       ft5, 1.0
-    nop
+    sw         a1, 0x0(a0)              /* m[0][0] = scaleX */
     .set reorder
-    swc1       ft5, 0x3C(a0)
-    sw         a1, 0x0(a0)
-    sw         a2, 0x14(a0)
-    sw         a3, 0x28(a0)
+    sw         a2, 0x14(a0)             /* m[1][1] = scaleY */
+    sw         a3, 0x28(a0)             /* m[2][2] = scaleZ */
+
     jr         ra
 END(mtxf_from_scale)
 

From f9f72c37dfc238b80ef518ec4da59c131c1e1e50 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 15:45:09 -0500
Subject: [PATCH 22/36] Doc atan2s

---
 src/hasm/ido/math_util.s | 146 ++++++++++++++++++++++-----------------
 src/hasm/math_util.c     |   4 ++
 2 files changed, 86 insertions(+), 64 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index c470a9dc0..f5042e70c 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2103,76 +2103,94 @@ LEAF(mtxf_from_scale)
     jr         ra
 END(mtxf_from_scale)
 
+/**
+ * Computes the arctangent of x/y, returning an angle in s16 format (0-65535 = 0-360°).
+ *
+ * This implements atan2(x, y) using a lookup table for the core arctangent
+ * calculation, with quadrant adjustment based on the signs of x and y.
+ *
+ * Arguments:
+ *   a0 = x coordinate (s32)
+ *   a1 = y coordinate (s32)
+ *
+ * Returns:
+ *   v0 = angle in s16 format (0x0000 = 0°, 0x4000 = 90°, 0x8000 = 180°, 0xC000 = 270°)
+ *
+ * Quadrant handling:
+ *   - Q1 (y >= 0, x >= 0): angle = atan(x/y), base = 0x0000
+ *   - Q2 (y < 0, x >= 0):  angle = 0x8000 - atan(x/y), base = 0x4000
+ *   - Q3 (y < 0, x < 0):   angle = 0x8000 + atan(x/y), base = 0x8000
+ *   - Q4 (y >= 0, x < 0):  angle = -atan(x/y), base = 0xC000
+ */
 LEAF(atan2s)
+    /* Check if both x and y are zero */
     or         t0, a0, a1
-    bne        zero, t0, .L80070680
-    li         v0, 0x0
+    bne        zero, t0, .atan2s_nonzero
+    li         v0, 0                    /* Return 0 if both inputs are zero */
     jr         ra
-    .L80070680:
-    bltz       a0, .L80070698
-    .set noreorder
-    bltzl      a1, .L800706B8
-    .set reorder
-    negu       a1
-    li         v0, 0x0
-    j          .L800706C8
-    .L80070698:
-    negu       a0
-    bltz       a1, .L800706A8
-    ori        v0, zero, 0xC000
-    j          .L800706BC
-    .L800706A8:
-    negu       a1
-    ori        v0, zero, 0x8000
-    j          .L800706C8
-    negu       a1
-    .L800706B8:
-    li         v0, 0x4000
-    .L800706BC:
-    xor        a0, a1
-    xor        a1, a0, a1
-    xor        a0, a1
-    .L800706C8:
-    subu       t0, a0, a1
-    .set noreorder
-    bltzl      t0, .L80070718
-    .set reorder
-    dsll       t0, a0, 11
-    dsll       t0, a1, 11
-    ddivu      zero, t0, a0
-    .set noreorder
+
+.atan2s_nonzero:
+    /* Determine quadrant based on signs of x (a0) and y (a1) */
+    bltz       a0, .atan2s_x_negative
+
+    /* x >= 0: check y sign */
+    bltz       a1, .atan2s_q2
+    li         v0, 0x0                  /* Q1: base angle = 0x0000 */
+    j          .atan2s_compute
+
+.atan2s_x_negative:
+    /* x < 0: make x positive and check y sign */
+    negu       a0                       /* a0 = |x| */
+    bltz       a1, .atan2s_q3
+    li         v0, 0xC000               /* Q4: base angle = 0xC000 (270°) */
+    j          .atan2s_swap_and_compute
+
+.atan2s_q3:
+    /* Quadrant 3: y < 0, x < 0 */
+    negu       a1                       /* a1 = |y| */
+    li         v0, 0x8000               /* Q3: base angle = 0x8000 (180°) */
+    j          .atan2s_compute
+
+.atan2s_q2:
+    /* Quadrant 2: y < 0, x >= 0 */
+    negu       a1                       /* a1 = |y| */
+    li         v0, 0x4000               /* Q2: base angle = 0x4000 (90°) */
+
+.atan2s_swap_and_compute:
+    /* Swap x and y for Q2 and Q4 quadrants (XOR swap) */
+    xor        a0, a0, a1               /* a0 ^= a1 */
+    xor        a1, a0, a1               /* a1 ^= a0 (a1 now has original a0) */
+    xor        a0, a0, a1               /* a0 ^= a1 (a0 now has original a1) */
+
+.atan2s_compute:
+    /* Determine if x < y to decide division order */
+    subu       t0, a0, a1               /* t0 = |x| - |y| */
+    bltz       t0, .atan2s_x_less_than_y
+
+    /* x >= y: compute atan(y/x) and add 90° offset */
+    dsll       t0, a1, 11               /* t0 = y << 11 */
+    ddivu      t0, a0                   /* divide (y << 11) / x */
+    mflo       t0                       /* Duplicate as ddivu already does this */
+    andi       t0, 0xFFE                /* mask to table index (even values only) */
     la         t1, gArcTanTable
-    addiu      v0, 0x4000
-    bnez       a0, .L800706F4
-    nop
-    .set reorder
-    break      7
-    .L800706F4:
-    mflo       t0
-    mflo       t0
-    andi       t0, 0xFFE
-    addu       t1, t0
-    lh         t0, 0x0(t1)
-    subu       v0, t0
-    andi       v0, 0xFFFF
+    addu       t1, t0                   /* t1 = &gArcTanTable[index] */
+    lh         t0, 0x0(t1)              /* t0 = atan table value */
+    addiu      v0, 0x4000               /* add 90° to base angle */
+    subu       v0, t0                   /* angle = base + 90° - atan(y/x) */
+    andi       v0, 0xFFFF               /* mask to 16-bit result */
     jr         ra
-    dsll       t0, a0, 11
-    .L80070718:
-    ddivu      zero, t0, a1
-    .set noreorder
+
+.atan2s_x_less_than_y:
+    /* x < y: compute atan(x/y) directly */
+    dsll       t0, a0, 11               /* t0 = x << 11 */
+    ddivu      t0, a1                   /* divide (x << 11) / y */
+    mflo       t0                       /* Duplicate as ddivu already does this */
+    andi       t0, 0xFFE                /* mask to table index (even values only) */
     la         t1, gArcTanTable
-    bnez       a1, .L80070730
-    nop
-    .set reorder
-    break      7
-    .L80070730:
-    mflo       t0
-    mflo       t0
-    andi       t0, 0xFFE
-    addu       t1, t0
-    lh         t0, 0x0(t1)
-    addu       v0, t0
-    andi       v0, 0xFFFF
+    addu       t1, t0                   /* t1 = &gArcTanTable[index] */
+    lh         t0, 0x0(t1)              /* t0 = atan table value */
+    addu       v0, t0                   /* angle = base + atan(x/y) */
+    andi       v0, 0xFFFF               /* mask to 16-bit result */
     jr         ra
 END(atan2s)
 
diff --git a/src/hasm/math_util.c b/src/hasm/math_util.c
index 3eab96feb..a01b57a0c 100644
--- a/src/hasm/math_util.c
+++ b/src/hasm/math_util.c
@@ -747,6 +747,10 @@ static u16 atan2_lookup(f32 y, f32 x) {
 s32 atan2s(s32 xDelta, s32 zDelta) {
     u16 ret;
 
+    if (xDelta == 0 && yDelta == 0) {
+        return 0;
+    }
+
     if (xDelta >= 0) {
         if (zDelta >= 0) {
             if (zDelta >= xDelta) {

From bc6aeb5aae240a24cd9166fef92fd36e84220ba2 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 15:53:07 -0500
Subject: [PATCH 23/36] Doc arctan2_f

---
 src/hasm/ido/math_util.s | 33 +++++++++++++++++++++++++--------
 1 file changed, 25 insertions(+), 8 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index f5042e70c..40844a079 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2194,15 +2194,32 @@ LEAF(atan2s)
     jr         ra
 END(atan2s)
 
+/**
+ * Computes the arctangent of two floating-point values, returning an angle in s16 format.
+ *
+ * This is a floating-point wrapper around atan2s. It scales the input floats
+ * by 255.0 and converts them to integers before calling atan2s.
+ *
+ * Arguments:
+ *   fa0 = x coordinate (f32, passed in $f12)
+ *   fa1 = y coordinate (f32, passed in $f14)
+ *
+ * Returns:
+ *   v0 = angle in s16 format (0x0000 = 0°, 0x4000 = 90°, 0x8000 = 180°, 0xC000 = 270°)
+ *
+ * Note: The scaling by 255.0 suggests this function expects normalized inputs
+ * in the range [-1.0, 1.0] or similar, converting them to roughly [-255, 255]
+ * for the integer atan2s function.
+ */
 LEAF(arctan2_f)
-    li.s       fv0, 255.0
-    mul.s      fa0, fv0
-    mul.s      fa1, fv0
-    cvt.w.s    fa0
-    cvt.w.s    fa1
-    mfc1       a0, fa0
-    mfc1       a1, fa1
-    j          atan2s
+    li.s       fv0, 255.0              /* fv0 = 255.0 (scale factor) */
+    mul.s      fa0, fv0                /* fa0 = x * 255.0 */
+    mul.s      fa1, fv0                /* fa1 = y * 255.0 */
+    cvt.w.s    fa0                     /* fa0 = (int)(x * 255.0) */
+    cvt.w.s    fa1                     /* fa1 = (int)(y * 255.0) */
+    mfc1       a0, fa0                 /* a0 = scaled x as integer */
+    mfc1       a1, fa1                 /* a1 = scaled y as integer */
+    j          atan2s                  /* tail call to atan2s(a0, a1) */
 END(arctan2_f)
 
 LEAF(fix32_sqrt)

From 9f8a6889ef95ae12f7a52c0daf8c2f1a41b424e9 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 16:11:52 -0500
Subject: [PATCH 24/36] more docs

---
 src/hasm/ido/math_util.s | 88 +++++++++++++++++++++++++++++-----------
 1 file changed, 64 insertions(+), 24 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 40844a079..972539df0 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2222,15 +2222,29 @@ LEAF(arctan2_f)
     j          atan2s                  /* tail call to atan2s(a0, a1) */
 END(arctan2_f)
 
+/**
+ * Computes the square root of a 16.16 fixed-point number.
+ *
+ * This function takes a 32-bit fixed-point number in 16.16 format,
+ * converts it to floating-point, computes the square root, and
+ * converts the result back to 16.16 fixed-point.
+ *
+ * Arguments:
+ *   a0 = input value in 16.16 fixed-point format (s32)
+ *        The value represents: (a0 / 65536.0)
+ *
+ * Returns:
+ *   v0 = sqrt(input) in 16.16 fixed-point format (s32)
+ */
 LEAF(fix32_sqrt)
-    mtc1       a0, fv0
-    li.s       fv1, 65536.0
-    cvt.s.w    fv0
-    div.s      fv0, fv1
-    sqrt.s     fv0
-    mul.s      fv0, fv1
-    cvt.w.s    fv0
-    mfc1       v0, fv0
+    mtc1       a0, fv0                 /* fv0 = input (as raw int bits) */
+    cvt.s.w    fv0                     /* fv0 = (float)a0 */
+    li.s       fv1, 65536.0            /* fv1 = 65536.0 (fixed-point scale) */
+    div.s      fv0, fv1                /* fv0 = a0 / 65536.0 (convert from 16.16) */
+    sqrt.s     fv0                     /* fv0 = sqrt(fv0) */
+    mul.s      fv0, fv1                /* fv0 = sqrt * 65536.0 (convert back to 16.16) */
+    cvt.w.s    fv0                     /* fv0 = (int)fv0 */
+    mfc1       v0, fv0                 /* v0 = result as integer */
     jr         ra
 END(fix32_sqrt)
 
@@ -2250,41 +2264,67 @@ END(fix32_sqrt)
  */
 LEAF(bad_int_sqrt)
     mtc1       a0, fv0      /* !@bug: moves int bits directly, no conversion */
-#ifdef AVOID_UB
-    cvt.s.w    fv0          /* This would fix the bug by converting the int to a float */
-    sqrt.s     fv0          /* compute sqrt */
-    cvt.w.s    fv0          /* convert the float back to an int */
-#else
     sqrt.s     fv0          /* computes sqrt of garbage float interpretation */
-#endif
     mfc1       v0, fv0      /* returns raw float bits as integer */
     jr         ra
 END(bad_int_sqrt)
 
+/**
+ * Computes the sine of an angle, returning a normalized floating-point result.
+ *
+ * This is a floating-point wrapper around sins_s16. It calls the integer
+ * sine function and normalizes the result from the s16 range [-32768, 32767]
+ * to the float range [-1.0, 1.0].
+ *
+ * Arguments:
+ *   a0 = angle in s16 format (0x0000 = 0°, 0x4000 = 90°, 0x8000 = 180°, 0xC000 = 270°)
+ *
+ * Returns:
+ *   fv0 = sin(angle) as float in range [-1.0, 1.0]
+ *
+ * The normalization factor 0.0000152587890625 = 1.0 / 65536.0 = 1.0 / 0x10000
+ * converts the s16 result (which ranges from -32768 to 32767) to a normalized float.
+ */
 LEAF(sins_f)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
 
-    jal        sins_s16
-    mtc1       v0, fv0
-    li.s       fv1, 0.0000152587890625 /* (1.0f / 0x10000) */
-    cvt.s.w    fv0
-    mul.s      fv0, fv1
+    jal        sins_s16                /* v0 = sin(angle) as s16 */
+    mtc1       v0, fv0                 /* fv0 = sin result (as int bits) */
+    cvt.s.w    fv0                     /* fv0 = (float)v0 */
+    li.s       fv1, 0.0000152587890625 /* fv1 = 1.0f / 0x10000 (normalization factor) */
+    mul.s      fv0, fv1                /* fv0 = sin(angle) normalized to [-1.0, 1.0] */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8
     jr         ra
 END(sins_f)
 
+/**
+ * Computes the cosine of an angle, returning a normalized floating-point result.
+ *
+ * This is a floating-point wrapper around coss_s16. It calls the integer
+ * cosine function and normalizes the result from the s16 range [-32768, 32767]
+ * to the float range [-1.0, 1.0].
+ *
+ * Arguments:
+ *   a0 = angle in s16 format (0x0000 = 0°, 0x4000 = 90°, 0x8000 = 180°, 0xC000 = 270°)
+ *
+ * Returns:
+ *   fv0 = cos(angle) as float in range [-1.0, 1.0]
+ *
+ * The normalization factor 0.0000152587890625 = 1.0 / 65536.0 = 1.0 / 0x10000
+ * converts the s16 result (which ranges from -32768 to 32767) to a normalized float.
+ */
 LEAF(coss_f)
     addiu      sp, sp, -0x8
     sd         ra, 0x0(sp)
 
-    jal        coss_s16
-    mtc1       v0, fv0
-    li.s       fv1, 0.0000152587890625 /* (1.0f / 0x10000) */
-    cvt.s.w    fv0
-    mul.s      fv0, fv1
+    jal        coss_s16                /* v0 = cos(angle) as s16 */
+    mtc1       v0, fv0                 /* fv0 = cos result (as int bits) */
+    cvt.s.w    fv0                     /* fv0 = (float)v0 */
+    li.s       fv1, 0.0000152587890625 /* fv1 = 1.0f / 0x10000 (normalization factor) */
+    mul.s      fv0, fv1                /* fv0 = cos(angle) normalized to [-1.0, 1.0] */
 
     ld         ra, 0x0(sp)
     addiu      sp, sp, 0x8

From 9f5a675d7779284ebb34d084f488a3282454ff02 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 11 Dec 2025 20:30:15 -0500
Subject: [PATCH 25/36] calc_dyn_lighting_for_level_segment cleanup

---
 src/hasm/ido/math_util.s             | 83 +++++++++++-----------------
 ver/symbols/symbol_addrs.jpn.v79.txt |  1 -
 ver/symbols/symbol_addrs.pal.v77.txt |  1 -
 ver/symbols/symbol_addrs.pal.v80.txt |  1 -
 ver/symbols/symbol_addrs.us.v77.txt  |  1 -
 ver/symbols/symbol_addrs.us.v80.txt  |  1 -
 6 files changed, 32 insertions(+), 56 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 972539df0..7a36f1a43 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2333,19 +2333,16 @@ END(coss_f)
 
 /* Official Name: mathCosInterp */
 LEAF(coss_s16)
-    addiu      a0, a0, 0x4000
+    addiu      a0, 0x4000
     /* Fall through */
 
 /* Official Name: mathSinInterp */
 XLEAF(sins_s16)
     sll        v0, a0, 17
-    .set noreorder
-    bgezl      v0, .L80070844
-    .set reorder
-    srl        t2, a0, 3
+    bgez       v0, .L80070844
     xori       a0, 0x7FFF
-    srl        t2, a0, 3
     .L80070844:
+    srl        t2, a0, 3
     andi       t2, 0x7FE
     la         v0, gSineTable
     addu       v0, t2
@@ -2376,13 +2373,10 @@ LEAF(coss_2)
 /* Official Name: mathSin */
 XLEAF(sins_2)
     sll        v0, a0, 17
-    .set noreorder
-    bgezl      v0, .L800708A4
-    .set reorder
-    srl        t2, a0, 3
+    bgez       v0, .L800708A4
     xori       a0, a0, 0x7FFF
-    srl        t2, a0, 3
     .L800708A4:
+    srl        t2, a0, 3
     andi       t2, 0x7FE
     la         v0, gSineTable
     addu       v0, t2
@@ -2410,80 +2404,67 @@ LEAF(calc_dyn_lighting_for_level_segment)
     .L800708F0:
     lbu        t4, 0x6(a2)
     addiu      t4, -0xFF
-    .set noreorder
-    beqzl      t4, .L80070A08
-    .set reorder
-    lhu        t4, 0x2(a2)
-    beql       v0, zero, .L80070934
+    beqz       t4, .L80070A08
+    beqzl      v0, .L80070934
     ori        t4, zero, 0xA
-    multu      v0, t4
     ori        t5, zero, 0xA
-    mflo       t4
+    mul        t4, v0, t4
     addu       a0, t4
-    multu      v0, t5
-    xor        v0, v0
-    mflo       t5
+    mul        t5, v0, t5
     addu       a1, t5
+    xor        v0, v0
     .L80070934:
     lhu        t5, 0x2(a2)
     lhu        t4, 0xE(a2)
-    addiu      a2, 0xC
     subu       t4, t5
+    addiu      a2, 0xC
     .L80070944:
     lh         t5, 0x0(a1)
     lh         t6, 0x2(a1)
     lh         t7, 0x4(a1)
-    lbu        t8, 0x7(a1)
     lbu        a3, 0x6(a1)
+    lbu        t8, 0x7(a1)
     lbu        t9, 0x8(a1)
     lbu        v1, 0x9(a1)
     sll        t8, 16
     or         t8, a3, t8
-    mult       t5, t1
-    mflo       t5
-    mult       t6, t2
-    mflo       t6
+    MULS       (t5, t5, t1)
+    MULS       (t6, t6, t2)
+    MULS       (t7, t7, t3)
     add        t5, t6
-    mult       t7, t3
-    mflo       t7
     add        t5, t7
     blez       t5, .L800709B4
     srl        t5, 22
     addu       v1, t5
-    sltiu      t5, v1, 0x81
+    sleu       t5, v1, 0x80
     bnez       t5, .L800709B4
-    ori        v1, zero, 0x80
+    li         v1, 0x80
     .L800709B4:
-    multu      v1, t8
-    addiu      a1, 0xA
-    addiu      t4, -0x1
-    addiu      a0, 0xA
-    mflo       t8
+    mul        t8, v1, t8
     srl        t8, 7
-    sb         t8, -0x4(a0)
-    multu      v1, t9
+    sb         t8, 6(a0)
     srl        t8, 16
-    sb         t8, -0x3(a0)
-    mflo       t9
+    sb         t8, 7(a0)
+    mul        t9, v1, t9
     srl        t9, 7
-    sb         t9, -0x2(a0)
-    bnel       t4, zero, .L80070944
-    addiu      t0, t0, -0x1
-    bnel       t0, zero, .L800708F0
+    sb         t9, 8(a0)
+    addiu      a1, 0xA
+    addiu      t4, -1
+    addiu      a0, 0xA
+    bnezl      t4, .L80070944
+    addiu      t0, -1
+    bnezl      t0, .L800708F0
     jr         ra
-END(calc_dyn_lighting_for_level_segment)
-
-LEAF(func_80070A04)
-    lhu        t4, 0x2(a2)
     .L80070A08:
+    lhu        t4, 0x2(a2)
     lhu        t5, 0xE(a2)
     addiu      a2, 0xC
-    addiu      t0, -0x1
+    addiu      t0, -1
     subu       t4, t5, t4
     addu       v0, t4
-    bnel       t0, zero, .L800708F0
+    bnezl      t0, .L800708F0
     jr         ra
-END(func_80070A04)
+END(calc_dyn_lighting_for_level_segment)
 
 LEAF(area_triangle_2d)
     mtc1       a2, ft0
diff --git a/ver/symbols/symbol_addrs.jpn.v79.txt b/ver/symbols/symbol_addrs.jpn.v79.txt
index aabc92b28..6b8adca19 100644
--- a/ver/symbols/symbol_addrs.jpn.v79.txt
+++ b/ver/symbols/symbol_addrs.jpn.v79.txt
@@ -1089,7 +1089,6 @@ sins_s16 = 0x80070910;
 coss_2 = 0x8007096C;
 sins_2 = 0x80070970;
 calc_dyn_lighting_for_level_segment = 0x800709B0;
-func_80070A04 = 0x80070AE4;
 area_triangle_2d = 0x80070B0C;
 set_breakpoint = 0x80070BB8;
 dmacopy_doubleword = 0x80070BE4;
diff --git a/ver/symbols/symbol_addrs.pal.v77.txt b/ver/symbols/symbol_addrs.pal.v77.txt
index bf04b5db9..013c3c8c2 100644
--- a/ver/symbols/symbol_addrs.pal.v77.txt
+++ b/ver/symbols/symbol_addrs.pal.v77.txt
@@ -1087,7 +1087,6 @@ sins_s16 = 0x80070830;
 coss_2 = 0x8007088C;
 sins_2 = 0x80070890;
 calc_dyn_lighting_for_level_segment = 0x800708D0;
-func_80070A04 = 0x80070A04;
 area_triangle_2d = 0x80070A2C;
 set_breakpoint = 0x80070AD8;
 dmacopy_doubleword = 0x80070B04;
diff --git a/ver/symbols/symbol_addrs.pal.v80.txt b/ver/symbols/symbol_addrs.pal.v80.txt
index 999bfcfe2..49ab5e35a 100644
--- a/ver/symbols/symbol_addrs.pal.v80.txt
+++ b/ver/symbols/symbol_addrs.pal.v80.txt
@@ -1025,7 +1025,6 @@ sins_s16 = 0x80070A70;
 coss_2 = 0x80070ACC;
 sins_2 = 0x80070AD0;
 calc_dyn_lighting_for_level_segment = 0x80070B10;
-func_80070A04 = 0x80070C44;
 area_triangle_2d = 0x80070C6C;
 set_breakpoint = 0x80070D18;
 dmacopy_doubleword = 0x80070D44;
diff --git a/ver/symbols/symbol_addrs.us.v77.txt b/ver/symbols/symbol_addrs.us.v77.txt
index 636e9b08d..fe100507e 100644
--- a/ver/symbols/symbol_addrs.us.v77.txt
+++ b/ver/symbols/symbol_addrs.us.v77.txt
@@ -1087,7 +1087,6 @@ sins_s16 = 0x80070830;
 coss_2 = 0x8007088C;
 sins_2 = 0x80070890;
 calc_dyn_lighting_for_level_segment = 0x800708D0;
-func_80070A04 = 0x80070A04;
 area_triangle_2d = 0x80070A2C;
 set_breakpoint = 0x80070AD8;
 dmacopy_doubleword = 0x80070B04;
diff --git a/ver/symbols/symbol_addrs.us.v80.txt b/ver/symbols/symbol_addrs.us.v80.txt
index 5a2b5b6d4..640f58dea 100644
--- a/ver/symbols/symbol_addrs.us.v80.txt
+++ b/ver/symbols/symbol_addrs.us.v80.txt
@@ -1025,7 +1025,6 @@ sins_s16 = 0x80070A70;
 coss_2 = 0x80070ACC;
 sins_2 = 0x80070AD0;
 calc_dyn_lighting_for_level_segment = 0x80070B10;
-func_80070A04 = 0x80070C44;
 area_triangle_2d = 0x80070C6C;
 set_breakpoint = 0x80070D18;
 dmacopy_doubleword = 0x80070D44;

From 8a952942f774173b052874d867ca778198d29aff Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 18 Dec 2025 14:30:37 -0500
Subject: [PATCH 26/36] fix build

---
 src/hasm/ido/math_util.s | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 7a36f1a43..e2e3b067c 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2438,7 +2438,7 @@ LEAF(calc_dyn_lighting_for_level_segment)
     addu       v1, t5
     sleu       t5, v1, 0x80
     bnez       t5, .L800709B4
-    li         v1, 0x80
+    ori        v1, zero, 0x80
     .L800709B4:
     mul        t8, v1, t8
     srl        t8, 7

From 4e89b90c8813bca9894edee6c8dcd3f68832767e Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 18 Dec 2025 14:58:17 -0500
Subject: [PATCH 27/36] Document area_triangle_2d

---
 src/hasm/ido/math_util.s | 98 ++++++++++++++++++++++++----------------
 1 file changed, 58 insertions(+), 40 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index e2e3b067c..1887559e7 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2466,47 +2466,65 @@ LEAF(calc_dyn_lighting_for_level_segment)
     jr         ra
 END(calc_dyn_lighting_for_level_segment)
 
+/**
+ * Computes the area of a 2D triangle using Herons formula.
+ *
+ * Arguments:
+ *   fa0 (f12) = x0 (vertex 0 X coordinate)
+ *   fa1 (f14) = z0 (vertex 0 Z coordinate)
+ *   a2       = x1 (vertex 1 X coordinate, passed as float bits in int reg)
+ *   a3       = z1 (vertex 1 Z coordinate, passed as float bits in int reg)
+ *   sp+0x10  = x2 (vertex 2 X coordinate)
+ *   sp+0x14  = z2 (vertex 2 Z coordinate)
+ *
+ * Returns:
+ *   fv0 = area of the triangle (f32)
+ */
 LEAF(area_triangle_2d)
-    mtc1       a2, ft0
-    mov.s      fv0, fa0
-    mtc1       a3, ft1
-    sub.s      fa0, ft0, fv0
-    mov.s      fv1, fa1
-    lwc1       ft2, 0x10(sp)
-    sub.s      fa1, ft1, fv1
-    mul.s      fa0, fa0
-    lwc1       ft3, 0x14(sp)
-    sub.s      ft4, ft2, ft0
-    mul.s      fa1, fa1
-    sub.s      ft5, ft3, ft1
-    mul.s      ft4, ft4
-    sub.s      fv0, ft2
-    mul.s      ft5, ft5
-    sub.s      fv1, ft3
-    mul.s      fv0, fv0
-    li.s       ft3, 0.5
-    add.s      fa0, fa1
-    mul.s      fv1, fv1
-    add.s      ft4, ft5
-    sqrt.s     fa0
-    sqrt.s     ft4
-    add.s      fv0, fv1
-    mtc1       zero, fv1
-    add.s      ft5, fa0, ft4
-    sqrt.s     fv0
-    add.s      ft5, fv0
-    mul.s      ft5, ft3, ft5
-    sub.s      ft0, ft5, fa0
-    sub.s      ft2, ft5, fv0
-    mul.s      fv0, ft0, ft5
-    sub.s      ft1, ft5, ft4
-    mul.s      ft1, ft2
-    mul.s      fv0, ft1
-    c.lt.s     fv0, fv1
-    bc1fl      .L80070AD0
-    mov.s      fv0, fv1
-    .L80070AD0:
-    sqrt.s     fv0
+    mov.s      fv0, fa0                /* fv0 = x0 */
+    mov.s      fv1, fa1                /* fv1 = z0 */
+    mtc1       a2, ft0                 /* ft0 = x1 */
+    mtc1       a3, ft1                 /* ft1 = z1 */
+    lwc1       ft2, 0x10(sp)           /* ft2 = x2 */
+    lwc1       ft3, 0x14(sp)           /* ft3 = z2 */
+
+    sub.s      fa0, ft0, fv0           /* fa0 = dx0 = x1 - x0 */
+    sub.s      fa1, ft1, fv1           /* fa1 = dz0 = z1 - z0 */
+    sub.s      ft4, ft2, ft0           /* ft4 = dx1 = x2 - x1 */
+    sub.s      ft5, ft3, ft1           /* ft5 = dz1 = z2 - z1 */
+    sub.s      fv0, ft2                /* fv0 = dx2 = x0 - x2 */
+    sub.s      fv1, ft3                /* fv1 = dz2 = z0 - z2 */
+    
+    mul.s      fa0, fa0                /* fa0 = dx0 * dx0 */
+    mul.s      fa1, fa1                /* fa1 = dz0 * dz0 */
+    mul.s      ft4, ft4                /* ft4 = dx1 * dx1 */
+    mul.s      ft5, ft5                /* ft5 = dz1 * dz1 */
+    mul.s      fv0, fv0                /* fv0 = dx2 * dx2 */
+    mul.s      fv1, fv1                /* fv1 = dz2 * dz2 */
+    add.s      fa0, fa1                /* fa0 = (dx0 * dx0) + (dz0 * dz0) */
+    add.s      ft4, ft5                /* ft4 = (dx1 * dx1) + (dz1 * dz1) */
+    add.s      fv0, fv1                /* fv0 = (dx2 * dx2) + (dz2 * dz2) */
+    sqrt.s     fa0                     /* fa0 = d0 = sqrt((dx0 * dx0) + (dz0 * dz0)) */
+    sqrt.s     ft4                     /* ft4 = d1 = sqrt((dx1 * dx1) + (dz1 * dz1)) */
+    sqrt.s     fv0                     /* fv0 = d2 = sqrt((dx2 * dx2) + (dz2 * dz2)) */
+    li.s       ft3, 0.5                /* ft3 = 0.5 */
+    add.s      ft5, fa0, ft4           /* ft5 = d0 + d1 */
+    add.s      ft5, fv0                /* ft5 = d0 + d1 + d2 */
+    mul.s      ft5, ft3, ft5           /* ft5 = s = (d0 + d1 + d2) * 0.5 */
+    sub.s      ft0, ft5, fa0           /* ft0 = s - d0 */
+    sub.s      ft1, ft5, ft4           /* ft1 = s - d1 */
+    sub.s      ft2, ft5, fv0           /* ft2 = s - d2 */
+    mul.s      fv0, ft0, ft5           /* fv0 = s * (s - d0) */
+    mul.s      ft1, ft2                /* ft1 = (s - d1) * (s - d2) */
+    mul.s      fv0, ft1                /* fv0 = s * (s-d0) * (s-d1) * (s-d2) */
+
+    mtc1       zero, fv1               /* fv1 = 0.0 */
+    c.lt.s     fv0, fv1                /* compare: fv0 < 0.0? */
+    bc1fl      .area_triangle_2d_positive
+    mov.s      fv0, fv1                /* fv0 = 0.0 (clamp negative to zero) */
+
+.area_triangle_2d_positive:
+    sqrt.s     fv0                     /* fv0 = sqrt(s * (s-d0) * (s-d1) * (s-d2)) = area */
     jr         ra
 END(area_triangle_2d)
 

From 00c2a660cc2d2011959b152151d31988243771f5 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 18 Dec 2025 15:10:53 -0500
Subject: [PATCH 28/36] more docs

---
 src/hasm/ido/math_util.s | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 1887559e7..c918fe1be 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -169,14 +169,14 @@ EXPORT(gArcTanTable)
 LEAF(interrupts_disable)
     lb         t0, gIntDisFlag
     .set noreorder
-    beqz       t0, .L8006F534
+    beqz       t0, .interrupts_disable_skip
     .set reorder
     MFC0(      t0, C0_SR)
-    and        t1, t0, -2
+    and        t1, t0, ~SR_IE
     MTC0(      t1, C0_SR)
-    andi       v0, t0, 0x1
+    andi       v0, t0, SR_IE
     NOP
-    .L8006F534:
+    .interrupts_disable_skip:
     jr         ra
 END(interrupts_disable)
 
@@ -184,14 +184,14 @@ END(interrupts_disable)
 LEAF(interrupts_enable)
     lb         t0, gIntDisFlag
     .set noreorder
-    beqz       t0, .L8006F55C
+    beqz       t0, .interrupts_enable_skip
     .set reorder
     MFC0(      t0, C0_SR)
-    or         t0, t0, a0
+    or         t0, a0
     MTC0(      t0, C0_SR)
     NOP
     NOP
-    .L8006F55C:
+    .interrupts_enable_skip:
     jr         ra
 END(interrupts_enable)
 
@@ -2529,9 +2529,9 @@ LEAF(area_triangle_2d)
 END(area_triangle_2d)
 
 LEAF(set_breakpoint)
-    ori        a0, a0, 0x1
+    ori        a0, WATCHLO_WTRAP
     MTC0(      a0, C0_WATCHLO)
-    addiu      t0, zero, 0xF
+    li         t0, WATCHHI_VALIDMASK
     MTC0(      t0, C0_WATCHHI)
     NOP
     NOP

From 661e805776329b43fb005ebd0dd0ba3cc928274d Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Thu, 18 Dec 2025 15:24:44 -0500
Subject: [PATCH 29/36] dmacopy_doubleword

---
 src/hasm/ido/math_util.s | 35 +++++++++++++++++++++++++++--------
 src/hasm/math_util.c     |  2 +-
 src/math_util.h          |  2 +-
 src/thread3_main.c       |  2 +-
 4 files changed, 30 insertions(+), 11 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index c918fe1be..9e498856a 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2541,13 +2541,32 @@ LEAF(set_breakpoint)
     jr         ra
 END(set_breakpoint)
 
+/**
+ * Copies memory in 16-byte chunks using 64-bit load/store instructions.
+ *
+ * This is an optimized memory copy routine that transfers 16 bytes per iteration
+ * using the MIPS 64-bit ld/sd instructions. The function entry point serves as
+ * the loop target, so the copy continues until the destination pointer reaches
+ * the specified end address.
+ *
+ * Arguments:
+ *   a0 = source pointer (must be 8-byte aligned)
+ *   a1 = destination pointer (must be 8-byte aligned)
+ *   a2 = destination end address (copy stops when a1 == a2)
+ *
+ * Note: The caller must ensure:
+ *   - Both source and destination are 8-byte aligned
+ *   - The copy size is a multiple of 16 bytes
+ *   - a2 > a1 (otherwise infinite loop or no-op if equal)
+ */
 LEAF(dmacopy_doubleword)
-    ld         t0, 0x0(a0)
-    ld         t1, 0x8(a0)
-    addi       a0, 0x10
-    addi       a1, 0x10
-    sd         t0, -0x10(a1)
-    sd         t1, -0x8(a1)
-    bne        a1, a2, dmacopy_doubleword
+    /* Function entry is also the loop entry point */
+    ld         t0, 0(a0)                /* t0 = load first doubleword from source */
+    ld         t1, 8(a0)                /* t1 = load second doubleword from source */
+    sd         t0, 0(a1)                /* store first doubleword to destination */
+    sd         t1, 8(a1)                /* store second doubleword to destination */
+    addi       a0, 16                   /* advance source pointer by 16 bytes */
+    addi       a1, 16                   /* advance destination pointer by 16 bytes */
+    bne        a1, a2, dmacopy_doubleword  /* loop until dest == end */
     jr         ra
-END(dmacopy_doubleword)
+END(dmacopy_doubleword)
\ No newline at end of file
diff --git a/src/hasm/math_util.c b/src/hasm/math_util.c
index a01b57a0c..6b0b19920 100644
--- a/src/hasm/math_util.c
+++ b/src/hasm/math_util.c
@@ -901,7 +901,7 @@ GLOBAL_ASM("asm/math_util/area_triangle_2d.s")
 GLOBAL_ASM("asm/math_util/set_breakpoint.s")
 
 #ifdef NON_MATCHING
-void dmacopy_doubleword(void *src, void *dst, s32 end) {
+void dmacopy_doubleword(void *src, void *dst, u32 end) {
     s32 size = end - (u32) dst;
     memcpy(dst, src, size);
 }
diff --git a/src/math_util.h b/src/math_util.h
index 22ba91931..3c9bd653e 100644
--- a/src/math_util.h
+++ b/src/math_util.h
@@ -64,7 +64,7 @@ void mtxf_from_translation(MtxF *mtx, f32 x, f32 y, f32 z);
 void mtxf_from_scale(MtxF *mtx, f32 scaleX, f32 scaleY, f32 scaleZ);
 s32 atan2s(s32 xDelta, s32 zDelta);
 f32 area_triangle_2d(f32 x0, f32 z0, f32 x1, f32 z1, f32 x2, f32 z2);
-void dmacopy_doubleword(void *src, void *dst, s32 end);
+void dmacopy_doubleword(void *src, void *dst, u32 end);
 StackInfo *stack_pointer(void);
 /**
  * Zero out the interrupt mask. This stops this thread
diff --git a/src/thread3_main.c b/src/thread3_main.c
index bd19ca18a..2429cf803 100644
--- a/src/thread3_main.c
+++ b/src/thread3_main.c
@@ -348,7 +348,7 @@ void main_game_loop(void) {
         if (osTvType == OS_TV_TYPE_PAL) {
             framebufferSize = (s32) ((SCREEN_WIDTH * SCREEN_HEIGHT * 2) * 1.1f);
         }
-        dmacopy_doubleword(gVideoLastFramebuffer, gVideoCurrFramebuffer, (s32) gVideoCurrFramebuffer + framebufferSize);
+        dmacopy_doubleword(gVideoLastFramebuffer, gVideoCurrFramebuffer, (u32) gVideoCurrFramebuffer + framebufferSize);
     }
     // tempLogicUpdateRate will be set to a value 2 or higher, based on the framerate.
     // the mul factor is hardcapped at 6, which happens at 10FPS. The mul factor

From fa582263900e4339ab3260fe3e623b4441916e96 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Fri, 19 Dec 2025 09:39:53 -0500
Subject: [PATCH 30/36] more docs

---
 src/hasm/ido/math_util.s | 148 ++++++++++++++++++++++++++++++++-------
 1 file changed, 122 insertions(+), 26 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 9e498856a..161429814 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -165,45 +165,118 @@ EXPORT(gArcTanTable)
 
 .text
 
-/* Official Name: disableInterrupts */
+/**
+ * Disables interrupts by clearing the IE (Interrupt Enable) bit in the CP0 Status register.
+ *
+ * Official Name: disableInterrupts
+ *
+ * This function checks the global interrupt disable flag before modifying
+ * the Status register. If the flag is zero, the function returns early
+ * without modifying anything.
+ *
+ * Arguments:
+ *   None
+ *
+ * Returns:
+ *   v0 = previous state of the IE bit (0 or 1), allowing restoration later
+ *        Only valid if gIntDisFlag was non-zero; undefined otherwise.
+ *
+ * CP0 Status Register (C0_SR) bit 0:
+ *   IE (Interrupt Enable): When set, interrupts are enabled globally.
+ *   Clearing this bit disables all maskable interrupts.
+ *
+ * Note: The NOP after MTC0 is required for CP0 hazard handling.
+ */
 LEAF(interrupts_disable)
-    lb         t0, gIntDisFlag
+    lb         t0, gIntDisFlag          /* t0 = interrupt disable flag */
     .set noreorder
-    beqz       t0, .interrupts_disable_skip
+    beqz       t0, .interrupts_disable_skip  /* if flag == 0, skip disable */
     .set reorder
-    MFC0(      t0, C0_SR)
-    and        t1, t0, ~SR_IE
-    MTC0(      t1, C0_SR)
-    andi       v0, t0, SR_IE
-    NOP
-    .interrupts_disable_skip:
+    MFC0(      t0, C0_SR)               /* t0 = current Status register */
+    and        t1, t0, ~SR_IE           /* t1 = SR with IE bit cleared (mask 0xFFFFFFFE) */
+    MTC0(      t1, C0_SR)               /* write back with interrupts disabled */
+    andi       v0, t0, SR_IE            /* v0 = previous IE bit state */
+    NOP                                 /* CP0 hazard barrier */
+.interrupts_disable_skip:
     jr         ra
 END(interrupts_disable)
 
-/* Official Name: enableInterrupts */
+/**
+ * Restores interrupts by setting the IE (Interrupt Enable) bit in the CP0 Status register.
+ *
+ * Official Name: enableInterrupts
+ *
+ * This function checks the global interrupt disable flag before modifying
+ * the Status register. If the flag is zero, the function returns early
+ * without modifying anything.
+ *
+ * Arguments:
+ *   a0 = interrupt state to restore (typically the value returned by interrupts_disable)
+ *        Bit 0 (IE) will be ORed into the Status register.
+ *
+ * Returns:
+ *   Nothing (void)
+ *
+ * CP0 Status Register (C0_SR) bit 0:
+ *   IE (Interrupt Enable): When set, interrupts are enabled globally.
+ *   Setting this bit enables all unmasked interrupts.
+ *
+ * Note: The two NOPs after MTC0 are required for CP0 hazard handling.
+ * More NOPs may be needed here than in disable because enabling interrupts
+ * can immediately trigger a pending interrupt.
+ */
 LEAF(interrupts_enable)
-    lb         t0, gIntDisFlag
+    lb         t0, gIntDisFlag          /* t0 = interrupt disable flag */
     .set noreorder
-    beqz       t0, .interrupts_enable_skip
+    beqz       t0, .interrupts_enable_skip  /* if flag == 0, skip enable */
     .set reorder
-    MFC0(      t0, C0_SR)
-    or         t0, a0
-    MTC0(      t0, C0_SR)
-    NOP
-    NOP
-    .interrupts_enable_skip:
+    MFC0(      t0, C0_SR)               /* t0 = current Status register */
+    or         t0, a0                   /* t0 = SR with IE bit restored from a0 */
+    MTC0(      t0, C0_SR)               /* write back with interrupts potentially enabled */
+    NOP                                 /* CP0 hazard barrier */
+    NOP                                 /* additional hazard for interrupt latency */
+.interrupts_enable_skip:
     jr         ra
 END(interrupts_enable)
 
-/* Official Name: setIntDisFlag */
+/**
+ * Sets the global interrupt disable flag.
+ *
+ * Official Name: setIntDisFlag
+ *
+ * This flag controls whether interrupts_disable and interrupts_enable
+ * actually modify the CP0 Status register. When the flag is 0, those
+ * functions become no-ops, allowing interrupt control to be globally
+ * disabled for debugging or special system states.
+ *
+ * Arguments:
+ *   a0 = new flag value (0 = disable interrupt control, non-zero = enable)
+ *
+ * Returns:
+ *   Nothing (void)
+ */
 LEAF(set_gIntDisFlag)
-    sb         a0, gIntDisFlag
+    sb         a0, gIntDisFlag          /* store new flag value */
     jr         ra
 END(set_gIntDisFlag)
 
-/* Official Name: getIntDisFlag */
+/**
+ * Gets the current value of the global interrupt disable flag.
+ *
+ * Official Name: getIntDisFlag
+ *
+ * This flag controls whether interrupts_disable and interrupts_enable
+ * actually modify the CP0 Status register. When the flag is 0, those
+ * functions become no-ops.
+ *
+ * Arguments:
+ *   None
+ *
+ * Returns:
+ *   v0 = current flag value (0 = interrupt control disabled, non-zero = enabled)
+ */
 LEAF(get_gIntDisFlag)
-    lbu        v0, gIntDisFlag
+    lbu        v0, gIntDisFlag          /* load flag value (unsigned byte) */
     jr         ra
 END(get_gIntDisFlag)
 
@@ -2528,11 +2601,34 @@ LEAF(area_triangle_2d)
     jr         ra
 END(area_triangle_2d)
 
+/**
+ * Configures a hardware watchpoint to break on memory writes to a specified address.
+ *
+ * Uses the MIPS CP0 WATCHLO/WATCHHI registers to set up a hardware breakpoint
+ * that triggers a Watch exception when a store instruction accesses the
+ * specified physical address.
+ *
+ * Arguments:
+ *   a0 = physical address to watch (low 32 bits)
+ *
+ * WATCHLO register format (CP0 register 18):
+ *   Bits 31-3: Physical address bits [31:3] (8-byte aligned)
+ *   Bit 2:     Reserved
+ *   Bit 1 (R): Watch for read accesses (loads)
+ *   Bit 0 (W): Watch for write accesses (stores)
+ *
+ * WATCHHI register format (CP0 register 19):
+ *   Bits 3-0:  Physical address bits [35:32] for 64-bit addressing
+ *
+ * Note: The NOPs after MTC0 instructions are required to handle CP0 hazards.
+ * The CPU needs pipeline cycles before watchpoint changes take effect.
+ */
 LEAF(set_breakpoint)
-    ori        a0, WATCHLO_WTRAP
-    MTC0(      a0, C0_WATCHLO)
-    li         t0, WATCHHI_VALIDMASK
-    MTC0(      t0, C0_WATCHHI)
+    ori        a0, WATCHLO_WTRAP        /* Set W bit: enable write watchpoint */
+    MTC0(      a0, C0_WATCHLO)          /* Store address + flags to WATCHLO */
+    li         t0, WATCHHI_VALIDMASK    /* t0 = 0xF (high address bits mask) */
+    MTC0(      t0, C0_WATCHHI)          /* Store high address bits to WATCHHI */
+    /* CP0 hazard barrier - pipeline must drain before watchpoint is active */
     NOP
     NOP
     NOP

From f0dc6d28fe1ac1d44c6541ffa642371f82cba37f Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Fri, 19 Dec 2025 09:55:58 -0500
Subject: [PATCH 31/36] work on standardizing some comments

---
 src/hasm/ido/math_util.s | 33 ++++++++++++++++++++++++++-------
 1 file changed, 26 insertions(+), 7 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 161429814..3f3957bfe 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -383,7 +383,9 @@ END(mtxf_to_mtxs)
 /**
  * Transforms a 3D vector using a 4×4 transformation matrix.
  * Perfect match to libultra compiled guMtxXFMF using -O3 -mips2
+ *
  * Official name: mathMtxXFMF
+ *
  * void mtxf_transform_point(float mf[4][4], float x, float y, float z, float *ox, float *oy, float *oz);
  */
 LEAF(mtxf_transform_point)
@@ -435,7 +437,9 @@ END(mtxf_transform_point)
  * This function multiplies the input vector by the upper-left 3×3 portion of the matrix mf,
  * ignoring the translation component. It is used for transforming directions, such as normals,
  * rather than points.
+ *
  * Official Name: mathMtxFastXFMF
+ *
  * Arguments:
  *   a0 = pointer to 4x4 matrix (float[4][4])
  *   a1 = pointer to input direction vector (float[3])
@@ -498,8 +502,11 @@ LEAF(mtxf_transform_dir)
     jr         ra
 END(mtxf_transform_dir)
 
-/* Official Name: mathMtxCatF
+/**
  * Multiplies two 4x4 floating-point matrices: result = m1 * m2
+ *
+ * Official Name: mathMtxCatF
+ *
  * Arguments:
  *   a0 = pointer to first matrix (m1)
  *   a1 = pointer to second matrix (m2)
@@ -600,8 +607,11 @@ LEAF(mtxf_mul)
     jr         ra
 END(mtxf_mul)
 
-/* Official Name: mathMtxF2L
+/**
  * Converts a 4x4 floating-point matrix to fixed-point integer matrix
+ *
+ * Official Name: mathMtxF2L
+ *
  * Arguments:
  *   a0 = pointer to source floating-point matrix (MtxF)
  *   a1 = pointer to destination fixed-point matrix (Mtx)
@@ -693,11 +703,17 @@ LEAF(get_rng_seed)
     jr         ra
 END(get_rng_seed)
 
-/* Official Name: mathRnd
- * Generates a random integer within the inclusive range [min, max].
+/**
+ * Generates a random integer within a specified range [min, max].
+ *
+ * Official Name: mathRnd
+ *
  * Arguments:
- *   a0 = min
- *   a1 = max
+ *   a0 = min (inclusive lower bound)
+ *   a1 = max (inclusive upper bound)
+ *
+ * Returns:
+ *   v0 = random integer in range [min, max]
  */
 LEAF(rand_range)
     lw         t0, gCurrentRNGSeed
@@ -722,8 +738,11 @@ LEAF(rand_range)
     jr         ra
 END(rand_range)
 
-/* Official Name: fastShortReflection
+/**
  * Reflects a vector across a given normal.
+ * 
+ * Official Name: fastShortReflection
+ * 
  * Fixed-point notes:
  *   - Inputs are 16-bit signed fixed-point values.
  *   - Dot product is accumulated in 32-bit, then shifted right by 12 to rescale.

From 5da89697867764ef8e2450c2c549daca0014f99b Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Fri, 19 Dec 2025 11:18:08 -0500
Subject: [PATCH 32/36] small cleanup for calc_dyn_lighting_for_level_segment

---
 src/hasm/ido/math_util.s | 34 ++++++++++++++++++++--------------
 1 file changed, 20 insertions(+), 14 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 3f3957bfe..66cee2c07 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2488,29 +2488,33 @@ LEAF(calc_dyn_lighting_for_level_segment)
     lw         t1, 0x0(a1)
     lw         t2, 0x4(a1)
     lw         t3, 0x8(a1)
+
     lhu        t0, 0x20(a0)
     lw         a2, 0xC(a0)
     lw         a1, 0x2C(a0)
     lw         a0, 0x0(a0)
     xor        v0, v0
-    .L800708F0:
+
+.L800708F0:
     lbu        t4, 0x6(a2)
-    addiu      t4, -0xFF
+    subu       t4, 0xFF
     beqz       t4, .L80070A08
     beqzl      v0, .L80070934
-    ori        t4, zero, 0xA
-    ori        t5, zero, 0xA
+    ori        t4, zero, 10
+    ori        t5, zero, 10
     mul        t4, v0, t4
-    addu       a0, t4
     mul        t5, v0, t5
-    addu       a1, t5
     xor        v0, v0
-    .L80070934:
+    addu       a0, t4
+    addu       a1, t5
+
+.L80070934:
     lhu        t5, 0x2(a2)
     lhu        t4, 0xE(a2)
     subu       t4, t5
     addiu      a2, 0xC
-    .L80070944:
+
+.L80070944:
     lh         t5, 0x0(a1)
     lh         t6, 0x2(a1)
     lh         t7, 0x4(a1)
@@ -2531,7 +2535,8 @@ LEAF(calc_dyn_lighting_for_level_segment)
     sleu       t5, v1, 0x80
     bnez       t5, .L800709B4
     ori        v1, zero, 0x80
-    .L800709B4:
+
+.L800709B4:
     mul        t8, v1, t8
     srl        t8, 7
     sb         t8, 6(a0)
@@ -2541,19 +2546,20 @@ LEAF(calc_dyn_lighting_for_level_segment)
     srl        t9, 7
     sb         t9, 8(a0)
     addiu      a1, 0xA
-    addiu      t4, -1
+    subu       t4, 1
     addiu      a0, 0xA
     bnezl      t4, .L80070944
-    addiu      t0, -1
+    subu       t0, 1
     bnezl      t0, .L800708F0
     jr         ra
-    .L80070A08:
+
+.L80070A08:
     lhu        t4, 0x2(a2)
     lhu        t5, 0xE(a2)
-    addiu      a2, 0xC
-    addiu      t0, -1
     subu       t4, t5, t4
     addu       v0, t4
+    addiu      a2, 0xC
+    subu       t0, 1
     bnezl      t0, .L800708F0
     jr         ra
 END(calc_dyn_lighting_for_level_segment)

From f42dae20c0bd1dc20adc67a9be274b5a6117a06b Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Fri, 19 Dec 2025 11:41:59 -0500
Subject: [PATCH 33/36] sins funcs cleanup and mild docs

---
 src/hasm/ido/math_util.s | 35 +++++++++++++++++++----------------
 1 file changed, 19 insertions(+), 16 deletions(-)

diff --git a/src/hasm/ido/math_util.s b/src/hasm/ido/math_util.s
index 66cee2c07..09cb28bdd 100644
--- a/src/hasm/ido/math_util.s
+++ b/src/hasm/ido/math_util.s
@@ -2431,9 +2431,10 @@ LEAF(coss_s16)
 /* Official Name: mathSinInterp */
 XLEAF(sins_s16)
     sll        v0, a0, 17
-    bgez       v0, .L80070844
+    bgez       v0, .sins_s16_first_half
     xori       a0, 0x7FFF
-    .L80070844:
+
+.sins_s16_first_half:
     srl        t2, a0, 3
     andi       t2, 0x7FE
     la         v0, gSineTable
@@ -2441,16 +2442,16 @@ XLEAF(sins_s16)
     lhu        t2, 0x2(v0)
     lhu        v0, 0x0(v0)
     andi       t1, a0, 0xF
-    sll        a0, 16
     subu       t2, v0
-    multu      t2, t1
-    sll        v0, 1
-    mflo       t2
+    mul        t2, t1
     srl        t2, 3
+    sll        v0, 1
     addu       v0, t2
-    bgez       a0, .L80070884
-    negu       v0
-    .L80070884:
+    sll        a0, 16
+    bgez       a0, .sins_s16_positive  /* if original angle < 180°, keep positive */
+    negu       v0                      /* negate for angles 180° to 360° */
+
+.sins_s16_positive:
     jr         ra
 END(coss_s16)
 #ifdef MODERN_CC
@@ -2459,15 +2460,16 @@ END(coss_s16)
 
 /* Official Name: mathCos */
 LEAF(coss_2)
-    addiu      a0, a0, 0x4000
+    addiu      a0, 0x4000
     /* Fall through */
 
 /* Official Name: mathSin */
 XLEAF(sins_2)
     sll        v0, a0, 17
-    bgez       v0, .L800708A4
-    xori       a0, a0, 0x7FFF
-    .L800708A4:
+    bgez       v0, .sins_2_first_half
+    xori       a0, 0x7FFF
+
+.sins_2_first_half:
     srl        t2, a0, 3
     andi       t2, 0x7FE
     la         v0, gSineTable
@@ -2475,9 +2477,10 @@ XLEAF(sins_2)
     lhu        v0, 0x0(v0)
     sll        v0, 1
     sll        a0, 16
-    bgez       a0, .L800708C8
-    negu       v0
-    .L800708C8:
+    bgez       a0, .sins_2_positive  /* if original angle < 180°, keep positive */
+    negu       v0                    /* negate for angles 180° to 360° */
+
+.sins_2_positive:
     jr         ra
 END(coss_2)
 #ifdef MODERN_CC

From de6900cb6733511080a23c673df9a1dd50e368b6 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Fri, 19 Dec 2025 11:51:04 -0500
Subject: [PATCH 34/36] Remove old file

---
 src/hasm/math_util.s | 1778 ------------------------------------------
 1 file changed, 1778 deletions(-)
 delete mode 100644 src/hasm/math_util.s

diff --git a/src/hasm/math_util.s b/src/hasm/math_util.s
deleted file mode 100644
index 8b3c79bc0..000000000
--- a/src/hasm/math_util.s
+++ /dev/null
@@ -1,1778 +0,0 @@
-.include "macro.inc"
-
-/* assembler directives */
-.set noat      /* allow manual use of $at */
-.set noreorder /* don't insert nops after branches */
-.set gp=64     /* allow use of 64-bit general purpose registers */
-
-.section .data
-
-dlabel gIntDisFlag
-.word 0x00000000
-
-dlabel gCurrentRNGSeed
-.word 0x5141564D /* 'QAVM' */
-
-dlabel gPrevRNGSeed
-.word 0x5141564D /* 'QAVM' */
-
-/* 1025 unsigned 16 bit integer values 0-1024 */
-dlabel gSineTable
-.half 0x0000, 0x0032, 0x0065, 0x0097, 0x00C9, 0x00FB, 0x012E, 0x0160, 0x0192, 0x01C4, 0x01F7, 0x0229, 0x025B, 0x028D, 0x02C0
-.half 0x02F2, 0x0324, 0x0356, 0x0389, 0x03BB, 0x03ED, 0x041F, 0x0452, 0x0484, 0x04B6, 0x04E8, 0x051B, 0x054D, 0x057F, 0x05B1
-.half 0x05E3, 0x0616, 0x0648, 0x067A, 0x06AC, 0x06DE, 0x0711, 0x0743, 0x0775, 0x07A7, 0x07D9, 0x080C, 0x083E, 0x0870, 0x08A2
-.half 0x08D4, 0x0906, 0x0938, 0x096B, 0x099D, 0x09CF, 0x0A01, 0x0A33, 0x0A65, 0x0A97, 0x0AC9, 0x0AFB, 0x0B2D, 0x0B60, 0x0B92
-.half 0x0BC4, 0x0BF6, 0x0C28, 0x0C5A, 0x0C8C, 0x0CBE, 0x0CF0, 0x0D22, 0x0D54, 0x0D86, 0x0DB8, 0x0DEA, 0x0E1C, 0x0E4E, 0x0E80
-.half 0x0EB2, 0x0EE4, 0x0F15, 0x0F47, 0x0F79, 0x0FAB, 0x0FDD, 0x100F, 0x1041, 0x1073, 0x10A4, 0x10D6, 0x1108, 0x113A, 0x116C
-.half 0x119E, 0x11CF, 0x1201, 0x1233, 0x1265, 0x1296, 0x12C8, 0x12FA, 0x132B, 0x135D, 0x138F, 0x13C1, 0x13F2, 0x1424, 0x1455
-.half 0x1487, 0x14B9, 0x14EA, 0x151C, 0x154D, 0x157F, 0x15B1, 0x15E2, 0x1614, 0x1645, 0x1677, 0x16A8, 0x16DA, 0x170B, 0x173C
-.half 0x176E, 0x179F, 0x17D1, 0x1802, 0x1833, 0x1865, 0x1896, 0x18C7, 0x18F9, 0x192A, 0x195B, 0x198D, 0x19BE, 0x19EF, 0x1A20
-.half 0x1A51, 0x1A83, 0x1AB4, 0x1AE5, 0x1B16, 0x1B47, 0x1B78, 0x1BA9, 0x1BDA, 0x1C0C, 0x1C3D, 0x1C6E, 0x1C9F, 0x1CD0, 0x1D01
-.half 0x1D31, 0x1D62, 0x1D93, 0x1DC4, 0x1DF5, 0x1E26, 0x1E57, 0x1E88, 0x1EB8, 0x1EE9, 0x1F1A, 0x1F4B, 0x1F7B, 0x1FAC, 0x1FDD
-.half 0x200E, 0x203E, 0x206F, 0x209F, 0x20D0, 0x2101, 0x2131, 0x2162, 0x2192, 0x21C3, 0x21F3, 0x2224, 0x2254, 0x2284, 0x22B5
-.half 0x22E5, 0x2316, 0x2346, 0x2376, 0x23A7, 0x23D7, 0x2407, 0x2437, 0x2467, 0x2498, 0x24C8, 0x24F8, 0x2528, 0x2558, 0x2588
-.half 0x25B8, 0x25E8, 0x2618, 0x2648, 0x2678, 0x26A8, 0x26D8, 0x2708, 0x2738, 0x2768, 0x2797, 0x27C7, 0x27F7, 0x2827, 0x2856
-.half 0x2886, 0x28B6, 0x28E5, 0x2915, 0x2945, 0x2974, 0x29A4, 0x29D3, 0x2A03, 0x2A32, 0x2A62, 0x2A91, 0x2AC1, 0x2AF0, 0x2B1F
-.half 0x2B4F, 0x2B7E, 0x2BAD, 0x2BDC, 0x2C0C, 0x2C3B, 0x2C6A, 0x2C99, 0x2CC8, 0x2CF7, 0x2D26, 0x2D55, 0x2D84, 0x2DB3, 0x2DE2
-.half 0x2E11, 0x2E40, 0x2E6F, 0x2E9E, 0x2ECC, 0x2EFB, 0x2F2A, 0x2F59, 0x2F87, 0x2FB6, 0x2FE5, 0x3013, 0x3042, 0x3070, 0x309F
-.half 0x30CD, 0x30FC, 0x312A, 0x3159, 0x3187, 0x31B5, 0x31E4, 0x3212, 0x3240, 0x326E, 0x329D, 0x32CB, 0x32F9, 0x3327, 0x3355
-.half 0x3383, 0x33B1, 0x33DF, 0x340D, 0x343B, 0x3469, 0x3497, 0x34C4, 0x34F2, 0x3520, 0x354E, 0x357B, 0x35A9, 0x35D7, 0x3604
-.half 0x3632, 0x365F, 0x368D, 0x36BA, 0x36E8, 0x3715, 0x3742, 0x3770, 0x379D, 0x37CA, 0x37F7, 0x3825, 0x3852, 0x387F, 0x38AC
-.half 0x38D9, 0x3906, 0x3933, 0x3960, 0x398D, 0x39BA, 0x39E7, 0x3A13, 0x3A40, 0x3A6D, 0x3A9A, 0x3AC6, 0x3AF3, 0x3B20, 0x3B4C
-.half 0x3B79, 0x3BA5, 0x3BD2, 0x3BFE, 0x3C2A, 0x3C57, 0x3C83, 0x3CAF, 0x3CDC, 0x3D08, 0x3D34, 0x3D60, 0x3D8C, 0x3DB8, 0x3DE4
-.half 0x3E10, 0x3E3C, 0x3E68, 0x3E94, 0x3EC0, 0x3EEC, 0x3F17, 0x3F43, 0x3F6F, 0x3F9A, 0x3FC6, 0x3FF1, 0x401D, 0x4048, 0x4074
-.half 0x409F, 0x40CB, 0x40F6, 0x4121, 0x414D, 0x4178, 0x41A3, 0x41CE, 0x41F9, 0x4224, 0x424F, 0x427A, 0x42A5, 0x42D0, 0x42FB
-.half 0x4326, 0x4351, 0x437B, 0x43A6, 0x43D1, 0x43FB, 0x4426, 0x4450, 0x447B, 0x44A5, 0x44D0, 0x44FA, 0x4524, 0x454F, 0x4579
-.half 0x45A3, 0x45CD, 0x45F7, 0x4621, 0x464B, 0x4675, 0x469F, 0x46C9, 0x46F3, 0x471D, 0x4747, 0x4770, 0x479A, 0x47C4, 0x47ED
-.half 0x4817, 0x4840, 0x486A, 0x4893, 0x48BD, 0x48E6, 0x490F, 0x4939, 0x4962, 0x498B, 0x49B4, 0x49DD, 0x4A06, 0x4A2F, 0x4A58
-.half 0x4A81, 0x4AAA, 0x4AD3, 0x4AFB, 0x4B24, 0x4B4D, 0x4B75, 0x4B9E, 0x4BC7, 0x4BEF, 0x4C17, 0x4C40, 0x4C68, 0x4C91, 0x4CB9
-.half 0x4CE1, 0x4D09, 0x4D31, 0x4D59, 0x4D81, 0x4DA9, 0x4DD1, 0x4DF9, 0x4E21, 0x4E49, 0x4E71, 0x4E98, 0x4EC0, 0x4EE8, 0x4F0F
-.half 0x4F37, 0x4F5E, 0x4F85, 0x4FAD, 0x4FD4, 0x4FFB, 0x5023, 0x504A, 0x5071, 0x5098, 0x50BF, 0x50E6, 0x510D, 0x5134, 0x515B
-.half 0x5181, 0x51A8, 0x51CF, 0x51F5, 0x521C, 0x5243, 0x5269, 0x5290, 0x52B6, 0x52DC, 0x5303, 0x5329, 0x534F, 0x5375, 0x539B
-.half 0x53C1, 0x53E7, 0x540D, 0x5433, 0x5459, 0x547F, 0x54A4, 0x54CA, 0x54F0, 0x5515, 0x553B, 0x5560, 0x5586, 0x55AB, 0x55D0
-.half 0x55F6, 0x561B, 0x5640, 0x5665, 0x568A, 0x56AF, 0x56D4, 0x56F9, 0x571E, 0x5743, 0x5767, 0x578C, 0x57B1, 0x57D5, 0x57FA
-.half 0x581E, 0x5843, 0x5867, 0x588C, 0x58B0, 0x58D4, 0x58F8, 0x591C, 0x5940, 0x5964, 0x5988, 0x59AC, 0x59D0, 0x59F4, 0x5A18
-.half 0x5A3B, 0x5A5F, 0x5A82, 0x5AA6, 0x5AC9, 0x5AED, 0x5B10, 0x5B34, 0x5B57, 0x5B7A, 0x5B9D, 0x5BC0, 0x5BE3, 0x5C06, 0x5C29
-.half 0x5C4C, 0x5C6F, 0x5C91, 0x5CB4, 0x5CD7, 0x5CF9, 0x5D1C, 0x5D3E, 0x5D61, 0x5D83, 0x5DA5, 0x5DC8, 0x5DEA, 0x5E0C, 0x5E2E
-.half 0x5E50, 0x5E72, 0x5E94, 0x5EB6, 0x5ED7, 0x5EF9, 0x5F1B, 0x5F3C, 0x5F5E, 0x5F80, 0x5FA1, 0x5FC2, 0x5FE4, 0x6005, 0x6026
-.half 0x6047, 0x6068, 0x6089, 0x60AA, 0x60CB, 0x60EC, 0x610D, 0x612E, 0x614E, 0x616F, 0x6190, 0x61B0, 0x61D1, 0x61F1, 0x6211
-.half 0x6232, 0x6252, 0x6272, 0x6292, 0x62B2, 0x62D2, 0x62F2, 0x6312, 0x6332, 0x6351, 0x6371, 0x6391, 0x63B0, 0x63D0, 0x63EF
-.half 0x640F, 0x642E, 0x644D, 0x646C, 0x648B, 0x64AB, 0x64CA, 0x64E9, 0x6507, 0x6526, 0x6545, 0x6564, 0x6582, 0x65A1, 0x65C0
-.half 0x65DE, 0x65FC, 0x661B, 0x6639, 0x6657, 0x6675, 0x6693, 0x66B2, 0x66D0, 0x66ED, 0x670B, 0x6729, 0x6747, 0x6764, 0x6782
-.half 0x67A0, 0x67BD, 0x67DA, 0x67F8, 0x6815, 0x6832, 0x6850, 0x686D, 0x688A, 0x68A7, 0x68C4, 0x68E0, 0x68FD, 0x691A, 0x6937
-.half 0x6953, 0x6970, 0x698C, 0x69A9, 0x69C5, 0x69E1, 0x69FD, 0x6A1A, 0x6A36, 0x6A52, 0x6A6E, 0x6A89, 0x6AA5, 0x6AC1, 0x6ADD
-.half 0x6AF8, 0x6B14, 0x6B30, 0x6B4B, 0x6B66, 0x6B82, 0x6B9D, 0x6BB8, 0x6BD3, 0x6BEE, 0x6C09, 0x6C24, 0x6C3F, 0x6C5A, 0x6C75
-.half 0x6C8F, 0x6CAA, 0x6CC4, 0x6CDF, 0x6CF9, 0x6D14, 0x6D2E, 0x6D48, 0x6D62, 0x6D7C, 0x6D96, 0x6DB0, 0x6DCA, 0x6DE4, 0x6DFE
-.half 0x6E17, 0x6E31, 0x6E4A, 0x6E64, 0x6E7D, 0x6E97, 0x6EB0, 0x6EC9, 0x6EE2, 0x6EFB, 0x6F14, 0x6F2D, 0x6F46, 0x6F5F, 0x6F78
-.half 0x6F90, 0x6FA9, 0x6FC2, 0x6FDA, 0x6FF2, 0x700B, 0x7023, 0x703B, 0x7053, 0x706B, 0x7083, 0x709B, 0x70B3, 0x70CB, 0x70E3
-.half 0x70FA, 0x7112, 0x712A, 0x7141, 0x7158, 0x7170, 0x7187, 0x719E, 0x71B5, 0x71CC, 0x71E3, 0x71FA, 0x7211, 0x7228, 0x723F
-.half 0x7255, 0x726C, 0x7282, 0x7299, 0x72AF, 0x72C5, 0x72DC, 0x72F2, 0x7308, 0x731E, 0x7334, 0x734A, 0x735F, 0x7375, 0x738B
-.half 0x73A0, 0x73B6, 0x73CB, 0x73E1, 0x73F6, 0x740B, 0x7421, 0x7436, 0x744B, 0x7460, 0x7475, 0x7489, 0x749E, 0x74B3, 0x74C7
-.half 0x74DC, 0x74F0, 0x7505, 0x7519, 0x752D, 0x7542, 0x7556, 0x756A, 0x757E, 0x7592, 0x75A6, 0x75B9, 0x75CD, 0x75E1, 0x75F4
-.half 0x7608, 0x761B, 0x762E, 0x7642, 0x7655, 0x7668, 0x767B, 0x768E, 0x76A1, 0x76B4, 0x76C7, 0x76D9, 0x76EC, 0x76FE, 0x7711
-.half 0x7723, 0x7736, 0x7748, 0x775A, 0x776C, 0x777E, 0x7790, 0x77A2, 0x77B4, 0x77C6, 0x77D8, 0x77E9, 0x77FB, 0x780C, 0x781E
-.half 0x782F, 0x7840, 0x7851, 0x7863, 0x7874, 0x7885, 0x7895, 0x78A6, 0x78B7, 0x78C8, 0x78D8, 0x78E9, 0x78F9, 0x790A, 0x791A
-.half 0x792A, 0x793A, 0x794A, 0x795B, 0x796A, 0x797A, 0x798A, 0x799A, 0x79AA, 0x79B9, 0x79C9, 0x79D8, 0x79E7, 0x79F7, 0x7A06
-.half 0x7A15, 0x7A24, 0x7A33, 0x7A42, 0x7A51, 0x7A60, 0x7A6E, 0x7A7D, 0x7A8C, 0x7A9A, 0x7AA8, 0x7AB7, 0x7AC5, 0x7AD3, 0x7AE1
-.half 0x7AEF, 0x7AFD, 0x7B0B, 0x7B19, 0x7B27, 0x7B34, 0x7B42, 0x7B50, 0x7B5D, 0x7B6A, 0x7B78, 0x7B85, 0x7B92, 0x7B9F, 0x7BAC
-.half 0x7BB9, 0x7BC6, 0x7BD3, 0x7BDF, 0x7BEC, 0x7BF9, 0x7C05, 0x7C11, 0x7C1E, 0x7C2A, 0x7C36, 0x7C42, 0x7C4E, 0x7C5A, 0x7C66
-.half 0x7C72, 0x7C7E, 0x7C89, 0x7C95, 0x7CA0, 0x7CAC, 0x7CB7, 0x7CC2, 0x7CCE, 0x7CD9, 0x7CE4, 0x7CEF, 0x7CFA, 0x7D05, 0x7D0F
-.half 0x7D1A, 0x7D25, 0x7D2F, 0x7D3A, 0x7D44, 0x7D4E, 0x7D58, 0x7D63, 0x7D6D, 0x7D77, 0x7D81, 0x7D8A, 0x7D94, 0x7D9E, 0x7DA7
-.half 0x7DB1, 0x7DBA, 0x7DC4, 0x7DCD, 0x7DD6, 0x7DE0, 0x7DE9, 0x7DF2, 0x7DFB, 0x7E03, 0x7E0C, 0x7E15, 0x7E1E, 0x7E26, 0x7E2F
-.half 0x7E37, 0x7E3F, 0x7E48, 0x7E50, 0x7E58, 0x7E60, 0x7E68, 0x7E70, 0x7E78, 0x7E7F, 0x7E87, 0x7E8E, 0x7E96, 0x7E9D, 0x7EA5
-.half 0x7EAC, 0x7EB3, 0x7EBA, 0x7EC1, 0x7EC8, 0x7ECF, 0x7ED6, 0x7EDD, 0x7EE3, 0x7EEA, 0x7EF0, 0x7EF7, 0x7EFD, 0x7F03, 0x7F0A
-.half 0x7F10, 0x7F16, 0x7F1C, 0x7F22, 0x7F27, 0x7F2D, 0x7F33, 0x7F38, 0x7F3E, 0x7F43, 0x7F49, 0x7F4E, 0x7F53, 0x7F58, 0x7F5D
-.half 0x7F62, 0x7F67, 0x7F6C, 0x7F71, 0x7F75, 0x7F7A, 0x7F7E, 0x7F83, 0x7F87, 0x7F8B, 0x7F90, 0x7F94, 0x7F98, 0x7F9C, 0x7FA0
-.half 0x7FA3, 0x7FA7, 0x7FAB, 0x7FAE, 0x7FB2, 0x7FB5, 0x7FB9, 0x7FBC, 0x7FBF, 0x7FC2, 0x7FC5, 0x7FC8, 0x7FCB, 0x7FCE, 0x7FD1
-.half 0x7FD3, 0x7FD6, 0x7FD9, 0x7FDB, 0x7FDD, 0x7FE0, 0x7FE2, 0x7FE4, 0x7FE6, 0x7FE8, 0x7FEA, 0x7FEC, 0x7FED, 0x7FEF, 0x7FF1
-.half 0x7FF2, 0x7FF4, 0x7FF5, 0x7FF6, 0x7FF7, 0x7FF8, 0x7FF9, 0x7FFA, 0x7FFB, 0x7FFC, 0x7FFD, 0x7FFE, 0x7FFE, 0x7FFF, 0x7FFF
-.half 0x7FFF, 0x8000, 0x8000, 0x8000, 0x8000
-
-/* 1025 unsigned 16 bit integer values 0-1024 */
-dlabel gArcTanTable
-.half 0x0000, 0x000A, 0x0014, 0x001F, 0x0029, 0x0033, 0x003D, 0x0047, 0x0051, 0x005C, 0x0066, 0x0070, 0x007A, 0x0084, 0x008F
-.half 0x0099, 0x00A3, 0x00AD, 0x00B7, 0x00C2, 0x00CC, 0x00D6, 0x00E0, 0x00EA, 0x00F4, 0x00FF, 0x0109, 0x0113, 0x011D, 0x0127
-.half 0x0131, 0x013C, 0x0146, 0x0150, 0x015A, 0x0164, 0x016F, 0x0179, 0x0183, 0x018D, 0x0197, 0x01A1, 0x01AC, 0x01B6, 0x01C0
-.half 0x01CA, 0x01D4, 0x01DE, 0x01E9, 0x01F3, 0x01FD, 0x0207, 0x0211, 0x021B, 0x0226, 0x0230, 0x023A, 0x0244, 0x024E, 0x0258
-.half 0x0262, 0x026D, 0x0277, 0x0281, 0x028B, 0x0295, 0x029F, 0x02A9, 0x02B4, 0x02BE, 0x02C8, 0x02D2, 0x02DC, 0x02E6, 0x02F0
-.half 0x02FB, 0x0305, 0x030F, 0x0319, 0x0323, 0x032D, 0x0337, 0x0341, 0x034C, 0x0356, 0x0360, 0x036A, 0x0374, 0x037E, 0x0388
-.half 0x0392, 0x039C, 0x03A7, 0x03B1, 0x03BB, 0x03C5, 0x03CF, 0x03D9, 0x03E3, 0x03ED, 0x03F7, 0x0401, 0x040C, 0x0416, 0x0420
-.half 0x042A, 0x0434, 0x043E, 0x0448, 0x0452, 0x045C, 0x0466, 0x0470, 0x047A, 0x0484, 0x048E, 0x0499, 0x04A3, 0x04AD, 0x04B7
-.half 0x04C1, 0x04CB, 0x04D5, 0x04DF, 0x04E9, 0x04F3, 0x04FD, 0x0507, 0x0511, 0x051B, 0x0525, 0x052F, 0x0539, 0x0543, 0x054D
-.half 0x0557, 0x0561, 0x056B, 0x0575, 0x057F, 0x0589, 0x0593, 0x059D, 0x05A7, 0x05B1, 0x05BB, 0x05C5, 0x05CF, 0x05D9, 0x05E3
-.half 0x05ED, 0x05F7, 0x0601, 0x060B, 0x0615, 0x061F, 0x0629, 0x0633, 0x063D, 0x0647, 0x0651, 0x065B, 0x0665, 0x066E, 0x0678
-.half 0x0682, 0x068C, 0x0696, 0x06A0, 0x06AA, 0x06B4, 0x06BE, 0x06C8, 0x06D2, 0x06DC, 0x06E5, 0x06EF, 0x06F9, 0x0703, 0x070D
-.half 0x0717, 0x0721, 0x072B, 0x0735, 0x073E, 0x0748, 0x0752, 0x075C, 0x0766, 0x0770, 0x077A, 0x0783, 0x078D, 0x0797, 0x07A1
-.half 0x07AB, 0x07B5, 0x07BE, 0x07C8, 0x07D2, 0x07DC, 0x07E6, 0x07EF, 0x07F9, 0x0803, 0x080D, 0x0817, 0x0820, 0x082A, 0x0834
-.half 0x083E, 0x0848, 0x0851, 0x085B, 0x0865, 0x086F, 0x0878, 0x0882, 0x088C, 0x0896, 0x089F, 0x08A9, 0x08B3, 0x08BD, 0x08C6
-.half 0x08D0, 0x08DA, 0x08E3, 0x08ED, 0x08F7, 0x0901, 0x090A, 0x0914, 0x091E, 0x0927, 0x0931, 0x093B, 0x0944, 0x094E, 0x0958
-.half 0x0961, 0x096B, 0x0975, 0x097E, 0x0988, 0x0992, 0x099B, 0x09A5, 0x09AE, 0x09B8, 0x09C2, 0x09CB, 0x09D5, 0x09DE, 0x09E8
-.half 0x09F2, 0x09FB, 0x0A05, 0x0A0E, 0x0A18, 0x0A22, 0x0A2B, 0x0A35, 0x0A3E, 0x0A48, 0x0A51, 0x0A5B, 0x0A64, 0x0A6E, 0x0A77
-.half 0x0A81, 0x0A8B, 0x0A94, 0x0A9E, 0x0AA7, 0x0AB1, 0x0ABA, 0x0AC4, 0x0ACD, 0x0AD7, 0x0AE0, 0x0AE9, 0x0AF3, 0x0AFC, 0x0B06
-.half 0x0B0F, 0x0B19, 0x0B22, 0x0B2C, 0x0B35, 0x0B3F, 0x0B48, 0x0B51, 0x0B5B, 0x0B64, 0x0B6E, 0x0B77, 0x0B80, 0x0B8A, 0x0B93
-.half 0x0B9D, 0x0BA6, 0x0BAF, 0x0BB9, 0x0BC2, 0x0BCB, 0x0BD5, 0x0BDE, 0x0BE7, 0x0BF1, 0x0BFA, 0x0C03, 0x0C0D, 0x0C16, 0x0C1F
-.half 0x0C29, 0x0C32, 0x0C3B, 0x0C45, 0x0C4E, 0x0C57, 0x0C60, 0x0C6A, 0x0C73, 0x0C7C, 0x0C86, 0x0C8F, 0x0C98, 0x0CA1, 0x0CAB
-.half 0x0CB4, 0x0CBD, 0x0CC6, 0x0CCF, 0x0CD9, 0x0CE2, 0x0CEB, 0x0CF4, 0x0CFD, 0x0D07, 0x0D10, 0x0D19, 0x0D22, 0x0D2B, 0x0D34
-.half 0x0D3E, 0x0D47, 0x0D50, 0x0D59, 0x0D62, 0x0D6B, 0x0D74, 0x0D7D, 0x0D87, 0x0D90, 0x0D99, 0x0DA2, 0x0DAB, 0x0DB4, 0x0DBD
-.half 0x0DC6, 0x0DCF, 0x0DD8, 0x0DE1, 0x0DEA, 0x0DF3, 0x0DFC, 0x0E05, 0x0E0F, 0x0E18, 0x0E21, 0x0E2A, 0x0E33, 0x0E3C, 0x0E45
-.half 0x0E4E, 0x0E56, 0x0E5F, 0x0E68, 0x0E71, 0x0E7A, 0x0E83, 0x0E8C, 0x0E95, 0x0E9E, 0x0EA7, 0x0EB0, 0x0EB9, 0x0EC2, 0x0ECB
-.half 0x0ED4, 0x0EDC, 0x0EE5, 0x0EEE, 0x0EF7, 0x0F00, 0x0F09, 0x0F12, 0x0F1B, 0x0F23, 0x0F2C, 0x0F35, 0x0F3E, 0x0F47, 0x0F50
-.half 0x0F58, 0x0F61, 0x0F6A, 0x0F73, 0x0F7C, 0x0F84, 0x0F8D, 0x0F96, 0x0F9F, 0x0FA7, 0x0FB0, 0x0FB9, 0x0FC2, 0x0FCA, 0x0FD3
-.half 0x0FDC, 0x0FE5, 0x0FED, 0x0FF6, 0x0FFF, 0x1007, 0x1010, 0x1019, 0x1021, 0x102A, 0x1033, 0x103B, 0x1044, 0x104D, 0x1055
-.half 0x105E, 0x1067, 0x106F, 0x1078, 0x1080, 0x1089, 0x1092, 0x109A, 0x10A3, 0x10AB, 0x10B4, 0x10BC, 0x10C5, 0x10CE, 0x10D6
-.half 0x10DF, 0x10E7, 0x10F0, 0x10F8, 0x1101, 0x1109, 0x1112, 0x111A, 0x1123, 0x112B, 0x1134, 0x113C, 0x1145, 0x114D, 0x1156
-.half 0x115E, 0x1166, 0x116F, 0x1177, 0x1180, 0x1188, 0x1191, 0x1199, 0x11A1, 0x11AA, 0x11B2, 0x11BB, 0x11C3, 0x11CB, 0x11D4
-.half 0x11DC, 0x11E4, 0x11ED, 0x11F5, 0x11FD, 0x1206, 0x120E, 0x1216, 0x121F, 0x1227, 0x122F, 0x1237, 0x1240, 0x1248, 0x1250
-.half 0x1259, 0x1261, 0x1269, 0x1271, 0x127A, 0x1282, 0x128A, 0x1292, 0x129A, 0x12A3, 0x12AB, 0x12B3, 0x12BB, 0x12C3, 0x12CC
-.half 0x12D4, 0x12DC, 0x12E4, 0x12EC, 0x12F4, 0x12FC, 0x1305, 0x130D, 0x1315, 0x131D, 0x1325, 0x132D, 0x1335, 0x133D, 0x1345
-.half 0x134D, 0x1355, 0x135E, 0x1366, 0x136E, 0x1376, 0x137E, 0x1386, 0x138E, 0x1396, 0x139E, 0x13A6, 0x13AE, 0x13B6, 0x13BE
-.half 0x13C6, 0x13CE, 0x13D6, 0x13DE, 0x13E6, 0x13ED, 0x13F5, 0x13FD, 0x1405, 0x140D, 0x1415, 0x141D, 0x1425, 0x142D, 0x1435
-.half 0x143D, 0x1444, 0x144C, 0x1454, 0x145C, 0x1464, 0x146C, 0x1473, 0x147B, 0x1483, 0x148B, 0x1493, 0x149B, 0x14A2, 0x14AA
-.half 0x14B2, 0x14BA, 0x14C1, 0x14C9, 0x14D1, 0x14D9, 0x14E0, 0x14E8, 0x14F0, 0x14F8, 0x14FF, 0x1507, 0x150F, 0x1516, 0x151E
-.half 0x1526, 0x152D, 0x1535, 0x153D, 0x1544, 0x154C, 0x1554, 0x155B, 0x1563, 0x156B, 0x1572, 0x157A, 0x1581, 0x1589, 0x1591
-.half 0x1598, 0x15A0, 0x15A7, 0x15AF, 0x15B7, 0x15BE, 0x15C6, 0x15CD, 0x15D5, 0x15DC, 0x15E4, 0x15EB, 0x15F3, 0x15FA, 0x1602
-.half 0x1609, 0x1611, 0x1618, 0x1620, 0x1627, 0x162F, 0x1636, 0x163E, 0x1645, 0x164C, 0x1654, 0x165B, 0x1663, 0x166A, 0x1671
-.half 0x1679, 0x1680, 0x1688, 0x168F, 0x1696, 0x169E, 0x16A5, 0x16AC, 0x16B4, 0x16BB, 0x16C2, 0x16CA, 0x16D1, 0x16D8, 0x16E0
-.half 0x16E7, 0x16EE, 0x16F6, 0x16FD, 0x1704, 0x170B, 0x1713, 0x171A, 0x1721, 0x1728, 0x1730, 0x1737, 0x173E, 0x1745, 0x174C
-.half 0x1754, 0x175B, 0x1762, 0x1769, 0x1770, 0x1778, 0x177F, 0x1786, 0x178D, 0x1794, 0x179B, 0x17A2, 0x17AA, 0x17B1, 0x17B8
-.half 0x17BF, 0x17C6, 0x17CD, 0x17D4, 0x17DB, 0x17E2, 0x17E9, 0x17F0, 0x17F7, 0x17FE, 0x1806, 0x180D, 0x1814, 0x181B, 0x1822
-.half 0x1829, 0x1830, 0x1837, 0x183E, 0x1845, 0x184C, 0x1853, 0x185A, 0x1860, 0x1867, 0x186E, 0x1875, 0x187C, 0x1883, 0x188A
-.half 0x1891, 0x1898, 0x189F, 0x18A6, 0x18AD, 0x18B3, 0x18BA, 0x18C1, 0x18C8, 0x18CF, 0x18D6, 0x18DD, 0x18E3, 0x18EA, 0x18F1
-.half 0x18F8, 0x18FF, 0x1906, 0x190C, 0x1913, 0x191A, 0x1921, 0x1928, 0x192E, 0x1935, 0x193C, 0x1943, 0x1949, 0x1950, 0x1957
-.half 0x195D, 0x1964, 0x196B, 0x1972, 0x1978, 0x197F, 0x1986, 0x198C, 0x1993, 0x199A, 0x19A0, 0x19A7, 0x19AE, 0x19B4, 0x19BB
-.half 0x19C2, 0x19C8, 0x19CF, 0x19D5, 0x19DC, 0x19E3, 0x19E9, 0x19F0, 0x19F6, 0x19FD, 0x1A04, 0x1A0A, 0x1A11, 0x1A17, 0x1A1E
-.half 0x1A24, 0x1A2B, 0x1A31, 0x1A38, 0x1A3E, 0x1A45, 0x1A4B, 0x1A52, 0x1A58, 0x1A5F, 0x1A65, 0x1A6C, 0x1A72, 0x1A79, 0x1A7F
-.half 0x1A86, 0x1A8C, 0x1A93, 0x1A99, 0x1A9F, 0x1AA6, 0x1AAC, 0x1AB3, 0x1AB9, 0x1AC0, 0x1AC6, 0x1ACC, 0x1AD3, 0x1AD9, 0x1ADF
-.half 0x1AE6, 0x1AEC, 0x1AF2, 0x1AF9, 0x1AFF, 0x1B05, 0x1B0C, 0x1B12, 0x1B18, 0x1B1F, 0x1B25, 0x1B2B, 0x1B32, 0x1B38, 0x1B3E
-.half 0x1B44, 0x1B4B, 0x1B51, 0x1B57, 0x1B5D, 0x1B64, 0x1B6A, 0x1B70, 0x1B76, 0x1B7D, 0x1B83, 0x1B89, 0x1B8F, 0x1B95, 0x1B9C
-.half 0x1BA2, 0x1BA8, 0x1BAE, 0x1BB4, 0x1BBA, 0x1BC1, 0x1BC7, 0x1BCD, 0x1BD3, 0x1BD9, 0x1BDF, 0x1BE5, 0x1BEB, 0x1BF2, 0x1BF8
-.half 0x1BFE, 0x1C04, 0x1C0A, 0x1C10, 0x1C16, 0x1C1C, 0x1C22, 0x1C28, 0x1C2E, 0x1C34, 0x1C3A, 0x1C40, 0x1C46, 0x1C4C, 0x1C52
-.half 0x1C58, 0x1C5E, 0x1C64, 0x1C6A, 0x1C70, 0x1C76, 0x1C7C, 0x1C82, 0x1C88, 0x1C8E, 0x1C94, 0x1C9A, 0x1CA0, 0x1CA6, 0x1CAC
-.half 0x1CB2, 0x1CB8, 0x1CBE, 0x1CC3, 0x1CC9, 0x1CCF, 0x1CD5, 0x1CDB, 0x1CE1, 0x1CE7, 0x1CED, 0x1CF3, 0x1CF8, 0x1CFE, 0x1D04
-.half 0x1D0A, 0x1D10, 0x1D16, 0x1D1B, 0x1D21, 0x1D27, 0x1D2D, 0x1D33, 0x1D38, 0x1D3E, 0x1D44, 0x1D4A, 0x1D4F, 0x1D55, 0x1D5B
-.half 0x1D61, 0x1D66, 0x1D6C, 0x1D72, 0x1D78, 0x1D7D, 0x1D83, 0x1D89, 0x1D8E, 0x1D94, 0x1D9A, 0x1DA0, 0x1DA5, 0x1DAB, 0x1DB1
-.half 0x1DB6, 0x1DBC, 0x1DC2, 0x1DC7, 0x1DCD, 0x1DD3, 0x1DD8, 0x1DDE, 0x1DE3, 0x1DE9, 0x1DEF, 0x1DF4, 0x1DFA, 0x1DFF, 0x1E05
-.half 0x1E0B, 0x1E10, 0x1E16, 0x1E1B, 0x1E21, 0x1E26, 0x1E2C, 0x1E32, 0x1E37, 0x1E3D, 0x1E42, 0x1E48, 0x1E4D, 0x1E53, 0x1E58
-.half 0x1E5E, 0x1E63, 0x1E69, 0x1E6E, 0x1E74, 0x1E79, 0x1E7F, 0x1E84, 0x1E8A, 0x1E8F, 0x1E94, 0x1E9A, 0x1E9F, 0x1EA5, 0x1EAA
-.half 0x1EB0, 0x1EB5, 0x1EBA, 0x1EC0, 0x1EC5, 0x1ECB, 0x1ED0, 0x1ED5, 0x1EDB, 0x1EE0, 0x1EE6, 0x1EEB, 0x1EF0, 0x1EF6, 0x1EFB
-.half 0x1F00, 0x1F06, 0x1F0B, 0x1F10, 0x1F16, 0x1F1B, 0x1F20, 0x1F26, 0x1F2B, 0x1F30, 0x1F36, 0x1F3B, 0x1F40, 0x1F45, 0x1F4B
-.half 0x1F50, 0x1F55, 0x1F5A, 0x1F60, 0x1F65, 0x1F6A, 0x1F6F, 0x1F75, 0x1F7A, 0x1F7F, 0x1F84, 0x1F8A, 0x1F8F, 0x1F94, 0x1F99
-.half 0x1F9E, 0x1FA4, 0x1FA9, 0x1FAE, 0x1FB3, 0x1FB8, 0x1FBD, 0x1FC3, 0x1FC8, 0x1FCD, 0x1FD2, 0x1FD7, 0x1FDC, 0x1FE1, 0x1FE6
-.half 0x1FEC, 0x1FF1, 0x1FF6, 0x1FFB, 0x2000
-
-
-.section .text, "ax"
-
-/* Official Name: disableInterrupts */
-glabel interrupts_disable
-lui        $t0, %hi(gIntDisFlag)
-lb         $t0, %lo(gIntDisFlag)($t0)
-beqz       $t0, .L8006F534
- mfc0      $t0, $12
-addiu      $at, $zero, -0x2
-and        $t1, $t0, $at
-mtc0       $t1, $12
-andi       $v0, $t0, 0x1
-nop
-.L8006F534:
-jr         $ra
- nop
-endlabel interrupts_disable
-
-/* Official Name: enableInterrupts */
-glabel interrupts_enable
-lui        $t0, %hi(gIntDisFlag)
-lb         $t0, %lo(gIntDisFlag)($t0)
-beqz       $t0, .L8006F55C
- mfc0      $t0, $12
-or         $t0, $t0, $a0
-mtc0       $t0, $12
-nop
-nop
-.L8006F55C:
-jr         $ra
- nop
-endlabel interrupts_enable
-
-/* Official Name: setIntDisFlag */
-glabel set_gIntDisFlag
-lui        $at, %hi(gIntDisFlag)
-jr         $ra
- sb        $a0, %lo(gIntDisFlag)($at)
-endlabel set_gIntDisFlag
-
-/* Official Name: getIntDisFlag */
-glabel get_gIntDisFlag
-lui        $v0, %hi(gIntDisFlag)
-jr         $ra
- lbu       $v0, %lo(gIntDisFlag)($v0)
-endlabel get_gIntDisFlag
-
-glabel mtx_to_mtxs
-ori        $t0, $zero, 0x4
-lui        $t7, 0xFFFF
-.L8006F584:
-lw         $t1, 0x0($a0)
-lw         $t2, 0x20($a0)
-lw         $t3, 0x4($a0)
-lw         $t4, 0x24($a0)
-sh         $t1, 0x4($a1)
-sh         $t2, 0x6($a1)
-sh         $t3, 0xC($a1)
-sh         $t4, 0xE($a1)
-srl        $t1, $t1, 16
-srl        $t2, $t2, 16
-srl        $t3, $t3, 16
-srl        $t4, $t4, 16
-addiu      $a0, $a0, 0x8
-sh         $t1, 0x0($a1)
-sh         $t2, 0x2($a1)
-sh         $t3, 0x8($a1)
-sh         $t4, 0xA($a1)
-addi       $a1, $a1, 0x10
-addiu      $t0, $t0, -0x1
-bnel       $t0, $zero, .L8006F584
- nop
-jr         $ra
- nop
-endlabel mtx_to_mtxs
-
-glabel mtxf_to_mtxs
-li.s       $at, 65536.0
-mtc1       $at, $f12
-ori        $t0, $zero, 0x4
-.L8006F5EC:
-lwc1       $f4, 0x0($a0)
-lwc1       $f6, 0x4($a0)
-lwc1       $f8, 0x8($a0)
-mul.s      $f4, $f4, $f12
-lwc1       $f10, 0xC($a0)
-addiu      $a0, $a0, 0x10
-mul.s      $f6, $f6, $f12
-addiu      $t0, $t0, -0x1
-addiu      $a1, $a1, 0x10
-mul.s      $f8, $f8, $f12
-nop
-mul.s      $f10, $f10, $f12
-trunc.w.s  $f4, $f4
-trunc.w.s  $f6, $f6
-swc1       $f4, -0x10($a1)
-trunc.w.s  $f8, $f8
-swc1       $f6, -0xC($a1)
-trunc.w.s  $f10, $f10
-swc1       $f8, -0x8($a1)
-swc1       $f10, -0x4($a1)
-bnel       $t0, $zero, .L8006F5EC
- nop
-jr         $ra
- nop
-endlabel mtxf_to_mtxs
-
-/* Official Name: mathMtxXFMF */
-glabel mtxf_transform_point
-mtc1       $a1, $f12
-lwc1       $f4, 0x0($a0)
-mtc1       $a2, $f14
-lwc1       $f8, 0x10($a0)
-mul.s      $f6, $f4, $f12
-mtc1       $a3, $f16
-lwc1       $f4, 0x20($a0)
-mul.s      $f10, $f8, $f14
-lw         $t6, 0x10($sp)
-mul.s      $f8, $f4, $f16
-add.s      $f18, $f6, $f10
-lwc1       $f10, 0x30($a0)
-add.s      $f6, $f18, $f8
-add.s      $f4, $f10, $f6
-swc1       $f4, 0x0($t6)
-lwc1       $f18, 0x4($a0)
-lwc1       $f10, 0x14($a0)
-lw         $t7, 0x14($sp)
-mul.s      $f8, $f18, $f12
-lwc1       $f18, 0x24($a0)
-mul.s      $f6, $f10, $f14
-add.s      $f4, $f8, $f6
-mul.s      $f10, $f18, $f16
-lwc1       $f6, 0x34($a0)
-add.s      $f8, $f4, $f10
-add.s      $f18, $f6, $f8
-swc1       $f18, 0x0($t7)
-lwc1       $f4, 0x8($a0)
-lwc1       $f6, 0x18($a0)
-lw         $t8, 0x18($sp)
-mul.s      $f10, $f4, $f12
-lwc1       $f4, 0x28($a0)
-mul.s      $f8, $f6, $f14
-add.s      $f18, $f10, $f8
-mul.s      $f6, $f4, $f16
-lwc1       $f8, 0x38($a0)
-add.s      $f10, $f18, $f6
-add.s      $f4, $f8, $f10
-jr         $ra
- swc1      $f4, 0x0($t8)
-endlabel mtxf_transform_point
-
-/* Official Name: mathMtxFastXFMF */
-glabel mtxf_transform_dir
-lwc1       $f4, 0x0($a1)
-lwc1       $f10, 0x0($a0)
-lwc1       $f6, 0x4($a1)
-lwc1       $f12, 0x10($a0)
-mul.s      $f10, $f4, $f10
-lwc1       $f8, 0x8($a1)
-lwc1       $f14, 0x20($a0)
-mul.s      $f12, $f6, $f12
-add.s      $f12, $f10, $f12
-mul.s      $f14, $f8, $f14
-lwc1       $f10, 0x4($a0)
-mul.s      $f10, $f4, $f10
-add.s      $f16, $f12, $f14
-lwc1       $f12, 0x14($a0)
-lwc1       $f14, 0x24($a0)
-mul.s      $f12, $f6, $f12
-swc1       $f16, 0x0($a2)
-mul.s      $f14, $f8, $f14
-add.s      $f12, $f10, $f12
-lwc1       $f10, 0x8($a0)
-add.s      $f16, $f12, $f14
-mul.s      $f10, $f4, $f10
-lwc1       $f12, 0x18($a0)
-lwc1       $f14, 0x28($a0)
-swc1       $f16, 0x4($a2)
-mul.s      $f12, $f6, $f12
-add.s      $f12, $f10, $f12
-mul.s      $f14, $f8, $f14
-add.s      $f14, $f12, $f14
-jr         $ra
- swc1      $f14, 0x8($a2)
-endlabel mtxf_transform_dir
-
-/* Official Name: mathMtxCatF */
-glabel mtxf_mul
-addiu      $sp, $sp, -0x8
-sdc1       $f2, 0x0($sp)
-ori        $t0, $zero, 0x4
-.L8006F774:
-lwc1       $f2, 0x0($a0)
-lwc1       $f10, 0x0($a1)
-lwc1       $f4, 0x4($a0)
-lwc1       $f12, 0x10($a1)
-mul.s      $f10, $f2, $f10
-lwc1       $f6, 0x8($a0)
-lwc1       $f14, 0x20($a1)
-mul.s      $f12, $f4, $f12
-lwc1       $f8, 0xC($a0)
-lwc1       $f16, 0x30($a1)
-mul.s      $f14, $f6, $f14
-addiu      $a0, $a0, 0x10
-addiu      $a2, $a2, 0x10
-mul.s      $f16, $f8, $f16
-addiu      $t0, $t0, -0x1
-add.s      $f14, $f12, $f14
-lwc1       $f12, 0x14($a1)
-add.s      $f16, $f10, $f16
-lwc1       $f10, 0x4($a1)
-mul.s      $f10, $f2, $f10
-add.s      $f18, $f14, $f16
-lwc1       $f14, 0x24($a1)
-mul.s      $f12, $f4, $f12
-lwc1       $f16, 0x34($a1)
-swc1       $f18, -0x10($a2)
-mul.s      $f14, $f6, $f14
-nop
-mul.s      $f16, $f8, $f16
-add.s      $f14, $f12, $f14
-lwc1       $f12, 0x18($a1)
-add.s      $f16, $f10, $f16
-lwc1       $f10, 0x8($a1)
-mul.s      $f10, $f2, $f10
-add.s      $f18, $f14, $f16
-lwc1       $f14, 0x28($a1)
-mul.s      $f12, $f4, $f12
-lwc1       $f16, 0x38($a1)
-swc1       $f18, -0xC($a2)
-mul.s      $f14, $f6, $f14
-nop
-mul.s      $f16, $f8, $f16
-add.s      $f14, $f12, $f14
-lwc1       $f12, 0x1C($a1)
-add.s      $f16, $f10, $f16
-lwc1       $f10, 0xC($a1)
-mul.s      $f10, $f2, $f10
-add.s      $f18, $f14, $f16
-lwc1       $f14, 0x2C($a1)
-mul.s      $f12, $f4, $f12
-lwc1       $f16, 0x3C($a1)
-swc1       $f18, -0x8($a2)
-mul.s      $f14, $f6, $f14
-nop
-mul.s      $f16, $f8, $f16
-add.s      $f14, $f12, $f14
-add.s      $f16, $f10, $f16
-add.s      $f18, $f14, $f16
-swc1       $f18, -0x4($a2)
-bnel       $t0, $zero, .L8006F774
- nop
-ldc1       $f2, 0x0($sp)
-jr         $ra
- addiu     $sp, $sp, 0x8
-endlabel mtxf_mul
-
-/* Official Name: mathMtxF2L */
-glabel mtxf_to_mtx
-li.s       $at, 65536.0
-mtc1       $at, $f12
-ori        $t0, $zero, 0x4
-.L8006F87C:
-lwc1       $f4, 0x0($a0)
-lwc1       $f6, 0x4($a0)
-lwc1       $f8, 0x8($a0)
-mul.s      $f4, $f4, $f12
-lwc1       $f10, 0xC($a0)
-addiu      $a0, $a0, 0x10
-mul.s      $f6, $f6, $f12
-addiu      $a1, $a1, 0x8
-addiu      $t0, $t0, -0x1
-mul.s      $f8, $f8, $f12
-nop
-mul.s      $f10, $f10, $f12
-cvt.w.s    $f4, $f4
-cvt.w.s    $f6, $f6
-mfc1       $t1, $f4
-cvt.w.s    $f8, $f8
-mfc1       $t2, $f6
-sh         $t1, 0x18($a1)
-cvt.w.s    $f10, $f10
-mfc1       $t3, $f8
-sh         $t2, 0x1A($a1)
-srl        $t1, $t1, 16
-mfc1       $t4, $f10
-sh         $t3, 0x1C($a1)
-srl        $t2, $t2, 16
-sh         $t4, 0x1E($a1)
-srl        $t3, $t3, 16
-srl        $t4, $t4, 16
-sh         $t1, -0x8($a1)
-sh         $t2, -0x6($a1)
-sh         $t3, -0x4($a1)
-sh         $t4, -0x2($a1)
-bnel       $t0, $zero, .L8006F87C
- nop
-jr         $ra
- nop
-endlabel mtxf_to_mtx
-
-/* Official Name: mathSeed */
-glabel set_rng_seed
-lui        $at, %hi(gCurrentRNGSeed)
-jr         $ra
- sw        $a0, %lo(gCurrentRNGSeed)($at)
-endlabel set_rng_seed
-
-glabel save_rng_seed
-lui        $a0, %hi(gCurrentRNGSeed)
-lw         $a0, %lo(gCurrentRNGSeed)($a0)
-lui        $at, %hi(gPrevRNGSeed)
-jr         $ra
- sw        $a0, %lo(gPrevRNGSeed)($at)
-endlabel save_rng_seed
-
-glabel load_rng_seed
-lui        $a0, %hi(gPrevRNGSeed)
-lw         $a0, %lo(gPrevRNGSeed)($a0)
-lui        $at, %hi(gCurrentRNGSeed)
-jr         $ra
- sw        $a0, %lo(gCurrentRNGSeed)($at)
-endlabel load_rng_seed
-
-glabel get_rng_seed
-lui        $v0, %hi(gCurrentRNGSeed)
-jr         $ra
- lw        $v0, %lo(gCurrentRNGSeed)($v0)
-endlabel get_rng_seed
-
-/* Official Name: mathRnd */
-glabel rand_range
-lui        $t0, %hi(gCurrentRNGSeed)
-lw         $t0, %lo(gCurrentRNGSeed)($t0)
-lui        $at, %hi(gCurrentRNGSeed)
-sub        $a1, $a1, $a0
-dsll32     $t1, $t0, 31
-dsll       $t2, $t0, 31
-dsrl       $t1, $t1, 31
-dsrl32     $t2, $t2, 0
-dsll32     $t3, $t0, 12
-or         $t1, $t1, $t2
-dsrl32     $t3, $t3, 0
-xor        $t1, $t1, $t3
-dsrl       $t3, $t1, 20
-andi       $t3, $t3, 0xFFF
-xor        $t0, $t3, $t1
-sw         $t0, %lo(gCurrentRNGSeed)($at)
-addi       $a1, $a1, 0x1
-subu       $t0, $t0, $a0
-divu       $zero, $t0, $a1
-mflo       $t0
-mfhi       $v0
-add        $v0, $v0, $a0
-bnez       $a1, .L8006F9B0
- nop
-break      7
-.L8006F9B0:
-jr         $ra
- nop
-endlabel rand_range
-
-/* Official Name: fastShortReflection */
-glabel vec3s_reflect
-lh         $t0, 0x0($a0)
-lh         $t3, 0x0($a1)
-lh         $t1, 0x2($a0)
-lh         $t4, 0x2($a1)
-mult       $t0, $t3
-lh         $t2, 0x4($a0)
-lh         $t5, 0x4($a1)
-mflo       $t6
-nop
-nop
-mult       $t1, $t4
-mflo       $t7
-add        $t6, $t6, $t7
-nop
-mult       $t2, $t5
-mflo       $t8
-add        $t6, $t6, $t8
-sra        $t6, $t6, 12
-mult       $t6, $t3
-mflo       $t3
-sra        $t3, $t3, 13
-sub        $t3, $t3, $t0
-mult       $t6, $t4
-sh         $t3, 0x6($a0)
-mflo       $t4
-sra        $t4, $t4, 13
-sub        $t4, $t4, $t1
-mult       $t6, $t5
-sh         $t4, 0x8($a0)
-mflo       $t5
-sra        $t5, $t5, 13
-sub        $t5, $t5, $t0
-jr         $ra
- sh        $t5, 0xA($a0)
-endlabel vec3s_reflect
-
-glabel mtx_to_mtxs_2
-ori        $t2, $zero, 0x10
-xor        $t3, $t3, $t3
-.L8006FA48:
-lh         $t0, 0x0($a0)
-lhu        $t1, 0x20($a0)
-addi       $a0, $a0, 0x2
-sll        $t0, $t0, 16
-or         $t0, $t0, $t1
-sw         $t0, 0x0($a1)
-addi       $a1, $a1, 0x4
-addiu      $t3, $t3, 0x1
-bnel       $t3, $t2, .L8006FA48
- nop
-jr         $ra
- nop
-endlabel mtx_to_mtxs_2
-
-glabel mtxs_transform_point
-lh         $t0, 0x0($a1)
-lw         $t3, 0x0($a0)
-lh         $t1, 0x2($a1)
-lh         $t2, 0x4($a1)
-mult       $t0, $t3
-lw         $t3, 0x10($a0)
-mflo       $t4
-nop
-nop
-mult       $t1, $t3
-lw         $t3, 0x20($a0)
-mflo       $t5
-add        $t4, $t4, $t5
-nop
-mult       $t2, $t3
-lw         $t3, 0x30($a0)
-mflo       $t6
-add        $t4, $t4, $t6
-add        $t4, $t4, $t3
-sra        $t4, $t4, 16
-sh         $t4, 0x0($a1)
-lw         $t3, 0x4($a0)
-mult       $t0, $t3
-lw         $t3, 0x14($a0)
-mflo       $t4
-nop
-nop
-mult       $t1, $t3
-lw         $t3, 0x24($a0)
-mflo       $t5
-add        $t4, $t4, $t5
-nop
-mult       $t2, $t3
-lw         $t3, 0x34($a0)
-mflo       $t6
-add        $t4, $t4, $t6
-add        $t4, $t4, $t3
-sra        $t4, $t4, 16
-sh         $t4, 0x2($a1)
-lw         $t3, 0x8($a0)
-mult       $t0, $t3
-lw         $t3, 0x18($a0)
-mflo       $t4
-nop
-nop
-mult       $t1, $t3
-lw         $t3, 0x28($a0)
-mflo       $t5
-add        $t4, $t4, $t5
-nop
-mult       $t2, $t3
-lw         $t3, 0x38($a0)
-mflo       $t6
-add        $t4, $t4, $t6
-add        $t4, $t4, $t3
-sra        $t4, $t4, 16
-jr         $ra
- sh        $t4, 0x4($a1)
-endlabel mtxs_transform_point
-
-glabel mtxs_transform_dir
-lw         $t3, 0x0($a0)
-lh         $t0, 0x0($a1)
-lh         $t1, 0x2($a1)
-lh         $t2, 0x4($a1)
-mult       $t0, $t3
-lw         $t3, 0x10($a0)
-mflo       $t4
-nop
-nop
-mult       $t1, $t3
-lw         $t3, 0x20($a0)
-mflo       $t5
-add        $t4, $t4, $t5
-nop
-mult       $t2, $t3
-lw         $t3, 0x4($a0)
-mflo       $t6
-add        $t4, $t4, $t6
-sra        $t4, $t4, 16
-mult       $t0, $t3
-sh         $t4, 0x0($a1)
-lw         $t3, 0x14($a0)
-mflo       $t4
-nop
-nop
-mult       $t1, $t3
-lw         $t3, 0x24($a0)
-mflo       $t5
-add        $t4, $t4, $t5
-nop
-mult       $t2, $t3
-lw         $t3, 0x8($a0)
-mflo       $t6
-add        $t4, $t4, $t6
-sra        $t4, $t4, 16
-mult       $t0, $t3
-sh         $t4, 0x2($a1)
-lw         $t3, 0x18($a0)
-mflo       $t4
-nop
-nop
-mult       $t1, $t3
-lw         $t3, 0x28($a0)
-mflo       $t5
-add        $t4, $t4, $t5
-nop
-mult       $t2, $t3
-mflo       $t6
-add        $t4, $t4, $t6
-sra        $t4, $t4, 16
-jr         $ra
- sh        $t4, 0x4($a1)
-endlabel mtxs_transform_dir
-
-glabel mtxf_from_transform
-addiu      $sp, $sp, -0x8
-li.s       $at, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         $ra, 0x0($sp)
-or         $a3, $a0, $zero
-mtc1       $at, $f18
-jal        sins_s16
- lh        $a0, 0x0($a1)
-mtc1       $v0, $f0
-lh         $a0, 0x0($a1)
-cvt.s.w    $f0, $f0
-mul.s      $f0, $f0, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f2
-lh         $a0, 0x2($a1)
-cvt.s.w    $f2, $f2
-mul.s      $f2, $f2, $f18
-jal        sins_s16
- nop
-mtc1       $v0, $f4
-lh         $a0, 0x2($a1)
-cvt.s.w    $f4, $f4
-mul.s      $f4, $f4, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f6
-lh         $a0, 0x4($a1)
-cvt.s.w    $f6, $f6
-mul.s      $f6, $f6, $f18
-jal        sins_s16
- nop
-mtc1       $v0, $f8
-lh         $a0, 0x4($a1)
-cvt.s.w    $f8, $f8
-mul.s      $f8, $f8, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f10
-lw         $t2, 0x8($a1)
-sw         $zero, 0xC($a3)
-cvt.s.w    $f10, $f10
-sw         $zero, 0x1C($a3)
-sw         $zero, 0x2C($a3)
-li.s       $at, 1.0
-mul.s      $f10, $f10, $f18
-nop
-mul.s      $f16, $f4, $f0
-nop
-mul.s      $f16, $f16, $f8
-nop
-mul.s      $f18, $f10, $f2
-add.s      $f16, $f16, $f18
-mtc1       $t2, $f18
-nop
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x0($a3)
-mul.s      $f16, $f8, $f6
-nop
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x4($a3)
-mul.s      $f16, $f4, $f2
-nop
-mul.s      $f16, $f16, $f8
-nop
-mul.s      $f18, $f10, $f0
-sub.s      $f16, $f16, $f18
-mtc1       $t2, $f18
-nop
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x8($a3)
-mul.s      $f16, $f4, $f0
-nop
-mul.s      $f16, $f16, $f10
-nop
-mul.s      $f18, $f8, $f2
-sub.s      $f16, $f16, $f18
-mtc1       $t2, $f18
-nop
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x10($a3)
-mul.s      $f16, $f10, $f6
-nop
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x14($a3)
-mul.s      $f16, $f4, $f2
-nop
-mul.s      $f16, $f16, $f10
-nop
-mul.s      $f18, $f8, $f0
-add.s      $f16, $f16, $f18
-mtc1       $t2, $f18
-nop
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x18($a3)
-mul.s      $f16, $f6, $f0
-nop
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x20($a3)
-mul.s      $f16, $f4, $f18
-neg.s      $f16, $f16
-swc1       $f16, 0x24($a3)
-mul.s      $f16, $f6, $f2
-nop
-mul.s      $f16, $f16, $f18
-mtc1       $at, $f18
-swc1       $f16, 0x28($a3)
-lw         $t0, 0xC($a1)
-sw         $t0, 0x30($a3)
-lw         $t0, 0x10($a1)
-sw         $t0, 0x34($a3)
-lw         $t0, 0x14($a1)
-swc1       $f18, 0x3C($a3)
-sw         $t0, 0x38($a3)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-jr         $ra
- nop
-endlabel mtxf_from_transform
-
-/* Official Name: mathSquashY */
-glabel mtxf_scale_y
-mtc1       $a1, $f18
-lwc1       $f16, 0x10($a0)
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x10($a0)
-lwc1       $f16, 0x14($a3)
-mul.s      $f16, $f16, $f18
-swc1       $f16, 0x14($a0)
-lwc1       $f16, 0x18($a0)
-mul.s      $f16, $f16, $f18
-jr         $ra
- swc1      $f16, 0x18($a0)
-endlabel mtxf_scale_y
-
-/* Official Name: mathTransY */
-glabel mtxf_translate_y
-mtc1       $a1, $f16
-lwc1       $f0, 0x10($a0)
-lwc1       $f4, 0x14($a0)
-lwc1       $f8, 0x18($a0)
-mul.s      $f0, $f0, $f16
-lwc1       $f2, 0x30($a0)
-lwc1       $f6, 0x34($a0)
-mul.s      $f4, $f4, $f16
-lwc1       $f10, 0x38($a0)
-mul.s      $f8, $f8, $f16
-add.s      $f0, $f0, $f2
-add.s      $f4, $f4, $f6
-swc1       $f0, 0x30($a0)
-add.s      $f8, $f8, $f10
-swc1       $f4, 0x34($a0)
-jr         $ra
- swc1      $f8, 0x38($a0)
-endlabel mtxf_translate_y
-
-/* Official Name: mathRpyXyzMtx */
-glabel mtxf_from_inverse_transform
-addiu      $sp, $sp, -0x8
-li.s       $at, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         $ra, 0x0($sp)
-or         $a3, $a0, $zero
-mtc1       $at, $f18
-jal        sins_s16
- lh        $a0, 0x0($a1)
-mtc1       $v0, $f0
-lh         $a0, 0x0($a1)
-cvt.s.w    $f0, $f0
-mul.s      $f0, $f0, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f2
-lh         $a0, 0x2($a1)
-cvt.s.w    $f2, $f2
-mul.s      $f2, $f2, $f18
-jal        sins_s16
- nop
-mtc1       $v0, $f4
-lh         $a0, 0x2($a1)
-cvt.s.w    $f4, $f4
-mul.s      $f4, $f4, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f6
-lh         $a0, 0x4($a1)
-cvt.s.w    $f6, $f6
-mul.s      $f6, $f6, $f18
-jal        sins_s16
- nop
-mtc1       $v0, $f8
-lh         $a0, 0x4($a1)
-cvt.s.w    $f8, $f8
-mul.s      $f8, $f8, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f10
-sw         $zero, 0xC($a3)
-swc1       $f4, 0x18($a3)
-cvt.s.w    $f10, $f10
-sw         $zero, 0x1C($a3)
-sw         $zero, 0x2C($a3)
-li.s       $at, 1.0
-mul.s      $f10, $f10, $f18
-nop
-mul.s      $f16, $f4, $f8
-nop
-mul.s      $f16, $f16, $f0
-nop
-mul.s      $f18, $f2, $f10
-sub.s      $f16, $f18, $f16
-swc1       $f16, 0x0($a3)
-mul.s      $f16, $f4, $f10
-nop
-mul.s      $f16, $f16, $f0
-nop
-mul.s      $f18, $f2, $f8
-add.s      $f16, $f16, $f18
-swc1       $f16, 0x4($a3)
-mul.s      $f16, $f0, $f6
-neg.s      $f16, $f16
-swc1       $f16, 0x8($a3)
-mul.s      $f16, $f6, $f8
-neg.s      $f16, $f16
-swc1       $f16, 0x10($a3)
-mul.s      $f16, $f6, $f10
-swc1       $f16, 0x14($a3)
-mul.s      $f16, $f4, $f8
-nop
-mul.s      $f16, $f16, $f2
-nop
-mul.s      $f18, $f0, $f10
-add.s      $f16, $f16, $f18
-swc1       $f16, 0x20($a3)
-mul.s      $f16, $f4, $f10
-nop
-mul.s      $f16, $f16, $f2
-nop
-mul.s      $f18, $f0, $f8
-sub.s      $f16, $f18, $f16
-lwc1       $f18, 0x0($a3)
-swc1       $f16, 0x24($a3)
-mul.s      $f16, $f2, $f6
-swc1       $f16, 0x28($a3)
-lwc1       $f0, 0xC($a1)
-lwc1       $f2, 0x10($a1)
-lwc1       $f16, 0x10($a3)
-mul.s      $f18, $f18, $f0
-lwc1       $f4, 0x14($a1)
-mul.s      $f16, $f16, $f2
-add.s      $f16, $f16, $f18
-lwc1       $f18, 0x20($a3)
-mul.s      $f18, $f18, $f4
-add.s      $f16, $f16, $f18
-lwc1       $f18, 0x4($a3)
-swc1       $f16, 0x30($a3)
-mul.s      $f18, $f18, $f0
-lwc1       $f16, 0x14($a3)
-mul.s      $f16, $f16, $f2
-add.s      $f16, $f16, $f18
-lwc1       $f18, 0x24($a3)
-mul.s      $f18, $f18, $f4
-add.s      $f16, $f16, $f18
-lwc1       $f18, 0x8($a3)
-swc1       $f16, 0x34($a3)
-mul.s      $f18, $f18, $f0
-lwc1       $f16, 0x18($a3)
-mul.s      $f16, $f16, $f2
-add.s      $f16, $f16, $f18
-lwc1       $f18, 0x28($a3)
-mul.s      $f18, $f18, $f4
-add.s      $f16, $f16, $f18
-swc1       $f16, 0x38($a3)
-mtc1       $at, $f16
-nop
-swc1       $f16, 0x3C($a3)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-jr         $ra
- nop
-endlabel mtxf_from_inverse_transform
-
-glabel func_80070058
-addiu      $sp, $sp, -0x8
-li.s       $at, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         $ra, 0x0($sp)
-or         $a3, $a0, $zero
-mtc1       $at, $f18
-jal        sins_s16
- lh        $a0, 0x0($a1)
-mtc1       $v0, $f0
-lh         $a0, 0x0($a1)
-cvt.s.w    $f0, $f0
-mul.s      $f0, $f0, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f2
-lh         $a0, 0x2($a1)
-cvt.s.w    $f2, $f2
-mul.s      $f2, $f2, $f18
-jal        sins_s16
- nop
-mtc1       $v0, $f4
-lh         $a0, 0x2($a1)
-cvt.s.w    $f4, $f4
-mul.s      $f4, $f4, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f6
-lh         $a0, 0x4($a1)
-cvt.s.w    $f6, $f6
-mul.s      $f6, $f6, $f18
-jal        sins_s16
- nop
-mtc1       $v0, $f8
-lh         $a0, 0x4($a1)
-cvt.s.w    $f8, $f8
-mul.s      $f8, $f8, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f10
-li.s       $at, 1.0
-sw         $zero, 0xC($a3)
-cvt.s.w    $f10, $f10
-sw         $zero, 0x1C($a3)
-sw         $zero, 0x2C($a3)
-mul.s      $f10, $f10, $f18
-mtc1       $at, $f18
-mul.s      $f12, $f0, $f6
-swc1       $f18, 0x3C($a3)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-mul.s      $f14, $f2, $f10
-nop
-mul.s      $f16, $f0, $f8
-jr         $ra
- nop
-endlabel func_80070058
-
-glabel mtxf_billboard
-addiu      $sp, $sp, -0x8
-or         $t9, $a3, $zero
-li.s       $at, 0.0000152587890625 /* (1.0f / 0x10000) */
-sd         $ra, 0x0($sp)
-or         $a3, $a0, $zero
-mtc1       $at, $f18
-jal        sins_s16
- or        $a0, $a1, $zero
-mtc1       $v0, $f8
-or         $a0, $a1, $zero
-cvt.s.w    $f8, $f8
-mul.s      $f8, $f8, $f18
-jal        coss_s16
- nop
-mtc1       $v0, $f10
-mtc1       $a2, $f16
-li.s       $at, 1.0
-cvt.s.w    $f10, $f10
-swc1       $f16, 0x28($a3)
-sw         $zero, 0x8($a3)
-sw         $zero, 0xC($a3)
-sw         $zero, 0x18($a3)
-sw         $zero, 0x1C($a3)
-mul.s      $f10, $f10, $f18
-mtc1       $t9, $f18
-sw         $zero, 0x20($a3)
-sw         $zero, 0x24($a3)
-sw         $zero, 0x2C($a3)
-sw         $zero, 0x30($a3)
-sw         $zero, 0x34($a3)
-mul.s      $f10, $f10, $f16
-sw         $zero, 0x38($a3)
-mul.s      $f8, $f8, $f16
-mtc1       $at, $f16
-swc1       $f10, 0x0($a3)
-mul.s      $f10, $f10, $f18
-swc1       $f16, 0x3C($a3)
-swc1       $f8, 0x4($a3)
-neg.s      $f8, $f8
-swc1       $f8, 0x10($a3)
-swc1       $f10, 0x14($a3)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-jr         $ra
- nop
-endlabel mtxf_billboard
-
-glabel vec3s_rotate_rpy
-addiu      $sp, $sp, -0x8
-sd         $ra, 0x0($sp)
-or         $a2, $a0, $zero
-lh         $t3, 0x0($a1)
-lh         $t4, 0x2($a1)
-lh         $t5, 0x4($a1)
-jal        sins_s16
- lh        $a0, 0x0($a2)
-or         $t6, $v0, $zero
-jal        coss_s16
- lh        $a0, 0x0($a2)
-mult       $t3, $t6
-or         $t7, $v0, $zero
-lh         $a0, 0x2($a2)
-mflo       $t0
-nop
-nop
-mult       $t4, $t6
-mflo       $t1
-nop
-nop
-mult       $t3, $t7
-mflo       $t3
-sub        $t3, $t3, $t1
-sra        $t3, $t3, 16
-mult       $t4, $t7
-mflo       $t4
-add        $t4, $t4, $t0
-jal        sins_s16
- sra       $t4, $t4, 16
-or         $t6, $v0, $zero
-jal        coss_s16
- lh        $a0, 0x2($a2)
-mult       $t4, $t6
-or         $t7, $v0, $zero
-lh         $a0, 0x4($a2)
-mflo       $t0
-nop
-nop
-mult       $t5, $t6
-mflo       $t1
-nop
-nop
-mult       $t4, $t7
-mflo       $t4
-sub        $t4, $t4, $t1
-sra        $t4, $t4, 16
-mult       $t5, $t7
-mflo       $t5
-add        $t5, $t5, $t0
-jal        sins_s16
- sra       $t5, $t5, 16
-or         $t6, $v0, $zero
-jal        coss_s16
- lh        $a0, 0x4($a2)
-mult       $t3, $t6
-or         $t7, $v0, $zero
-sh         $t4, 0x2($a1)
-mflo       $t0
-nop
-nop
-mult       $t5, $t6
-mflo       $t1
-nop
-nop
-mult       $t3, $t7
-mflo       $t3
-add        $t3, $t3, $t1
-sra        $t3, $t3, 16
-mult       $t5, $t7
-sh         $t3, 0x0($a1)
-mflo       $t5
-sub        $t5, $t5, $t0
-sra        $t5, $t5, 16
-sh         $t5, 0x4($a1)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-jr         $ra
- nop
-endlabel vec3s_rotate_rpy
-
-/* Official Name: mathOneFloatRPY */
-glabel vec3f_rotate
-addiu      $sp, $sp, -0x8
-sd         $ra, 0x0($sp)
-or         $a2, $a0, $zero
-lwc1       $f4, 0x0($a1)
-lwc1       $f6, 0x4($a1)
-lwc1       $f8, 0x8($a1)
-jal        sins_f
- lh        $a0, 0x4($a2)
-mul.s      $f10, $f4, $f0
-lh         $a0, 0x4($a2)
-mul.s      $f12, $f6, $f0
-jal        coss_f
- nop
-mul.s      $f4, $f4, $f0
-lh         $a0, 0x2($a2)
-mul.s      $f6, $f6, $f0
-sub.s      $f4, $f4, $f12
-jal        sins_f
- add.s     $f6, $f6, $f10
-mul.s      $f10, $f6, $f0
-lh         $a0, 0x2($a2)
-mul.s      $f12, $f8, $f0
-jal        coss_f
- nop
-mul.s      $f6, $f6, $f0
-lh         $a0, 0x0($a2)
-mul.s      $f8, $f8, $f0
-sub.s      $f6, $f6, $f12
-jal        sins_f
- add.s     $f8, $f8, $f10
-mul.s      $f10, $f4, $f0
-lh         $a0, 0x0($a2)
-mul.s      $f12, $f8, $f0
-jal        coss_f
- nop
-mul.s      $f4, $f4, $f0
-swc1       $f6, 0x4($a1)
-mul.s      $f8, $f8, $f0
-add.s      $f4, $f4, $f12
-sub.s      $f8, $f8, $f10
-swc1       $f4, 0x0($a1)
-swc1       $f8, 0x8($a1)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-jr         $ra
- nop
-endlabel vec3f_rotate
-
-/* Official Name: mathOneFloatYPR */
-glabel vec3f_rotate_ypr
-addiu      $sp, $sp, -0x8
-sd         $ra, 0x0($sp)
-or         $a2, $a0, $zero
-lwc1       $f4, 0x0($a1)
-lwc1       $f6, 0x4($a1)
-lwc1       $f8, 0x8($a1)
-jal        sins_f
- lh        $a0, 0x0($a2)
-mul.s      $f10, $f4, $f0
-lh         $a0, 0x0($a2)
-mul.s      $f12, $f8, $f0
-jal        coss_f
- nop
-mul.s      $f4, $f4, $f0
-lh         $a0, 0x2($a2)
-mul.s      $f8, $f8, $f0
-add.s      $f4, $f4, $f12
-jal        sins_f
- sub.s     $f8, $f8, $f10
-mul.s      $f10, $f6, $f0
-lh         $a0, 0x2($a2)
-mul.s      $f12, $f8, $f0
-jal        coss_f
- nop
-mul.s      $f6, $f6, $f0
-lh         $a0, 0x4($a2)
-mul.s      $f8, $f8, $f0
-sub.s      $f6, $f6, $f12
-jal        sins_f
- add.s     $f8, $f8, $f10
-mul.s      $f10, $f4, $f0
-lh         $a0, 0x4($a2)
-mul.s      $f12, $f6, $f0
-jal        coss_f
- nop
-mul.s      $f4, $f4, $f0
-swc1       $f8, 0x8($a1)
-mul.s      $f6, $f6, $f0
-sub.s      $f4, $f4, $f12
-add.s      $f6, $f6, $f10
-swc1       $f4, 0x0($a1)
-swc1       $f6, 0x4($a1)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-jr         $ra
- nop
-endlabel vec3f_rotate_ypr
-
-/* Official Name: mathOneFloatPY */
-glabel vec3f_rotate_py
-addiu      $sp, $sp, -0x8
-sd         $ra, 0x0($sp)
-or         $a2, $a0, $zero
-lwc1       $f8, 0x8($a1)
-jal        sins_f
- lh        $a0, 0x2($a2)
-mul.s      $f6, $f8, $f0
-jal        coss_f
- lh        $a0, 0x2($a2)
-mul.s      $f8, $f8, $f0
-neg.s      $f6, $f6
-jal        sins_f
- lh        $a0, 0x0($a2)
-mul.s      $f4, $f8, $f0
-jal        coss_f
- lh        $a0, 0x0($a2)
-mul.s      $f8, $f8, $f0
-swc1       $f4, 0x0($a1)
-swc1       $f6, 0x4($a1)
-swc1       $f8, 0x8($a1)
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-jr         $ra
- nop
-endlabel vec3f_rotate_py
-
-/* Official Name: mathXZInTri */
-glabel tri2d_xz_contains_point
-lw         $t6, 0x10($sp)
-lh         $t0, 0x0($a2)
-lh         $t1, 0x4($a2)
-lh         $t3, 0x4($a3)
-lh         $t4, 0x0($t6)
-lh         $t5, 0x4($t6)
-sub        $t6, $a0, $t0
-sub        $t7, $t3, $t1
-multu      $t6, $t7
-lh         $t2, 0x0($a3)
-sub        $t9, $a1, $t1
-addiu      $v0, $zero, 0x0
-sub        $t8, $t2, $t0
-ori        $a3, $zero, 0x1
-mflo       $t6
-mflo       $t6
-nop
-nop
-multu      $t8, $t9
-mflo       $t7
-mflo       $t8
-sub        $t6, $t6, $t7
-bgezl      $t6, .L80070558
- sub       $t6, $a0, $t2
-xor        $a3, $a3, $a3
-sub        $t6, $a0, $t2
-.L80070558:
-sub        $t7, $t5, $t3
-multu      $t6, $t7
-sub        $t8, $t4, $t2
-sub        $t9, $a1, $t3
-ori        $a2, $zero, 0x1
-mflo       $t6
-mflo       $t6
-nop
-nop
-multu      $t8, $t9
-mflo       $t7
-mflo       $t8
-sub        $t6, $t6, $t7
-bgez       $t6, .L80070598
- nop
-xor        $a2, $a2, $a2
-.L80070598:
-bne        $a3, $a2, .L800705F0
- nop
-sub        $t6, $a0, $t4
-sub        $t7, $t1, $t5
-multu      $t6, $t7
-sub        $t8, $t0, $t4
-sub        $t9, $a1, $t5
-ori        $a1, $zero, 0x1
-mflo       $t6
-mflo       $t6
-nop
-nop
-multu      $t8, $t9
-mflo       $t7
-mflo       $t8
-sub        $t6, $t6, $t7
-bgez       $t6, .L800705E4
- nop
-xor        $a1, $a1, $a1
-.L800705E4:
-bne        $a1, $a2, .L800705F0
- nop
-ori        $v0, $zero, 0x1
-.L800705F0:
-jr         $ra
- nop
-endlabel tri2d_xz_contains_point
-
-/* Official Name: mathTranslateMtx */
-glabel mtxf_from_translation
-or         $t0, $a0, $zero
-addiu      $t1, $t0, 0x40
-.L80070600:
-addiu      $t0, $t0, 0x4
-bne        $t1, $t0, .L80070600
- sw        $zero, -0x4($t0)
-li.s       $at, 1.0
-mtc1       $at, $f18
-nop
-swc1       $f18, 0x0($a0)
-swc1       $f18, 0x14($a0)
-swc1       $f18, 0x28($a0)
-swc1       $f18, 0x3C($a0)
-sw         $a1, 0x30($a0)
-sw         $a2, 0x34($a0)
-jr         $ra
- sw        $a3, 0x38($a0)
-endlabel mtxf_from_translation
-
-/* Official Name: mathScaleMtx */
-glabel mtxf_from_scale
-or         $t0, $a0, $zero
-addiu      $t1, $t0, 0x40
-.L80070640:
-addiu      $t0, $t0, 0x4
-bne        $t1, $t0, .L80070640
- sw        $zero, -0x4($t0)
-li.s       $at, 1.0
-mtc1       $at, $f18
-nop
-swc1       $f18, 0x3C($a0)
-sw         $a1, 0x0($a0)
-sw         $a2, 0x14($a0)
-jr         $ra
- sw        $a3, 0x28($a0)
-endlabel mtxf_from_scale
-
-glabel atan2s
-or         $t0, $a0, $a1
-bne        $zero, $t0, .L80070680
- nop
-jr         $ra
- addiu     $v0, $zero, 0x0
-.L80070680:
-bltz       $a0, .L80070698
- nop
-bltzl      $a1, .L800706B8
- negu      $a1, $a1
-j          .L800706C8
- addiu     $v0, $zero, 0x0
-.L80070698:
-bltz       $a1, .L800706A8
- negu      $a0, $a0
-j          .L800706BC
- ori       $v0, $zero, 0xC000
-.L800706A8:
-negu       $a1, $a1
-j          .L800706C8
- ori       $v0, $zero, 0x8000
-negu       $a1, $a1
-.L800706B8:
-addiu      $v0, $zero, 0x4000
-.L800706BC:
-xor        $a0, $a0, $a1
-xor        $a1, $a0, $a1
-xor        $a0, $a0, $a1
-.L800706C8:
-subu       $t0, $a0, $a1
-bltzl      $t0, .L80070718
- dsll      $t0, $a0, 11
-dsll       $t0, $a1, 11
-ddivu      $zero, $t0, $a0
-lui        $t1, %hi(gArcTanTable)
-addiu      $t1, $t1, %lo(gArcTanTable)
-addiu      $v0, $v0, 0x4000
-bnez       $a0, .L800706F4
- nop
-break      7
-.L800706F4:
-mflo       $t0
-mflo       $t0
-andi       $t0, $t0, 0xFFE
-addu       $t1, $t1, $t0
-lh         $t0, 0x0($t1)
-subu       $v0, $v0, $t0
-jr         $ra
- andi      $v0, $v0, 0xFFFF
-dsll       $t0, $a0, 11
-.L80070718:
-ddivu      $zero, $t0, $a1
-lui        $t1, %hi(gArcTanTable)
-addiu      $t1, $t1, %lo(gArcTanTable)
-bnez       $a1, .L80070730
- nop
-break      7
-.L80070730:
-mflo       $t0
-mflo       $t0
-andi       $t0, $t0, 0xFFE
-addu       $t1, $t1, $t0
-lh         $t0, 0x0($t1)
-addu       $v0, $v0, $t0
-jr         $ra
- andi      $v0, $v0, 0xFFFF
-endlabel atan2s
-
-glabel arctan2_f
-li.s       $at, 255.0
-mtc1       $at, $f0
-nop
-mul.s      $f12, $f12, $f0
-nop
-mul.s      $f14, $f14, $f0
-cvt.w.s    $f12, $f12
-cvt.w.s    $f14, $f14
-mfc1       $a0, $f12
-mfc1       $a1, $f14
-j          atan2s
- nop
-endlabel arctan2_f
-
-glabel fix32_sqrt
-mtc1       $a0, $f0
-li.s       $at, 65536.0
-mtc1       $at, $f2
-cvt.s.w    $f0, $f0
-div.s      $f0, $f0, $f2
-sqrt.s     $f0, $f0
-mul.s      $f0, $f0, $f2
-cvt.w.s    $f0, $f0
-mfc1       $v0, $f0
-jr         $ra
- nop
-endlabel fix32_sqrt
-
-glabel bad_int_sqrt
-mtc1       $a0, $f0
-nop
-sqrt.s     $f0, $f0
-mfc1       $v0, $f0
-jr         $ra
- nop
-endlabel bad_int_sqrt
-
-glabel sins_f
-addiu      $sp, $sp, -0x8
-sd         $ra, 0x0($sp)
-jal        sins_s16
- nop
-mtc1       $v0, $f0
-li.s       $at, 0.0000152587890625 /* (1.0f / 0x10000) */
-mtc1       $at, $f2
-cvt.s.w    $f0, $f0
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-mul.s      $f0, $f0, $f2
-jr         $ra
- nop
-endlabel sins_f
-
-glabel coss_f
-addiu      $sp, $sp, -0x8
-sd         $ra, 0x0($sp)
-jal        coss_s16
- nop
-mtc1       $v0, $f0
-li.s       $at, 0.0000152587890625 /* (1.0f / 0x10000) */
-mtc1       $at, $f2
-cvt.s.w    $f0, $f0
-ld         $ra, 0x0($sp)
-addiu      $sp, $sp, 0x8
-mul.s      $f0, $f0, $f2
-jr         $ra
- nop
-endlabel coss_f
-
-/* Official Name: mathCosInterp */
-glabel coss_s16
-addiu      $a0, $a0, 0x4000
-/* Fall through */
-
-/* Official Name: mathSinInterp */
-alabel sins_s16 
-sll        $v0, $a0, 17
-bgezl      $v0, .L80070844
-srl        $t2, $a0, 3
-xori       $a0, $a0, 0x7FFF
-srl        $t2, $a0, 3
-.L80070844:
-lui        $v0, %hi(gSineTable)
-andi       $t2, $t2, 0x7FE
-addiu      $v0, $v0, %lo(gSineTable)
-addu       $v0, $v0, $t2
-lhu        $t2, 0x2($v0)
-lhu        $v0, 0x0($v0)
-andi       $t1, $a0, 0xF
-sll        $a0, $a0, 16
-subu       $t2, $t2, $v0
-multu      $t2, $t1
-sll        $v0, $v0, 1
-mflo       $t2
-srl        $t2, $t2, 3
-bgez       $a0, .L80070884
- addu      $v0, $v0, $t2
-negu       $v0, $v0
-.L80070884:
-jr         $ra
-nop
-endlabel coss_s16
-.size sins_s16, . - sins_s16
-
-/* Official Name: mathCos */
-glabel coss_2
-addiu      $a0, $a0, 0x4000
-/* Fall through */
-
-/* Official Name: mathSin */
-alabel sins_2
-sll        $v0, $a0, 17
-bgezl      $v0, .L800708A4
-srl        $t2, $a0, 3
-xori       $a0, $a0, 0x7FFF
-srl        $t2, $a0, 3
-.L800708A4:
-lui        $v0, %hi(gSineTable)
-andi       $t2, $t2, 0x7FE
-addiu      $v0, $v0, %lo(gSineTable)
-addu       $v0, $v0, $t2
-lhu        $v0, 0x0($v0)
-sll        $a0, $a0, 16
-bgez       $a0, .L800708C8
-sll       $v0, $v0, 1
-negu       $v0, $v0
-.L800708C8:
-jr         $ra
-nop
-endlabel coss_2
-.size sins_2, . - sins_2
-
-glabel calc_dyn_lighting_for_level_segment
-lw         $t1, 0x0($a1)
-lw         $t2, 0x4($a1)
-lw         $t3, 0x8($a1)
-lhu        $t0, 0x20($a0)
-lw         $a2, 0xC($a0)
-lw         $a1, 0x2C($a0)
-lw         $a0, 0x0($a0)
-xor        $v0, $v0, $v0
-.L800708F0:
-lbu        $t4, 0x6($a2)
-addiu      $t4, $t4, -0xFF
-beql       $t4, $zero, .L80070A08
- lhu       $t4, 0x2($a2)
-beql       $v0, $zero, .L80070934
- nop
-ori        $t4, $zero, 0xA
-multu      $v0, $t4
-ori        $t5, $zero, 0xA
-mflo       $t4
-addu       $a0, $a0, $t4
-nop
-multu      $v0, $t5
-xor        $v0, $v0, $v0
-mflo       $t5
-addu       $a1, $a1, $t5
-nop
-.L80070934:
-lhu        $t5, 0x2($a2)
-lhu        $t4, 0xE($a2)
-addiu      $a2, $a2, 0xC
-subu       $t4, $t4, $t5
-.L80070944:
-lh         $t5, 0x0($a1)
-lh         $t6, 0x2($a1)
-lh         $t7, 0x4($a1)
-mult       $t5, $t1
-lbu        $t8, 0x7($a1)
-lbu        $a3, 0x6($a1)
-lbu        $t9, 0x8($a1)
-sll        $t8, $t8, 16
-lbu        $v1, 0x9($a1)
-or         $t8, $a3, $t8
-mflo       $t5
-nop
-nop
-mult       $t6, $t2
-mflo       $t6
-add        $t5, $t5, $t6
-nop
-mult       $t7, $t3
-mflo       $t7
-add        $t5, $t5, $t7
-blez       $t5, .L800709B4
- nop
-srl        $t5, $t5, 22
-addu       $v1, $v1, $t5
-sltiu      $t5, $v1, 0x81
-bnez       $t5, .L800709B4
- nop
-ori        $v1, $zero, 0x80
-.L800709B4:
-multu      $v1, $t8
-addiu      $a1, $a1, 0xA
-addiu      $t4, $t4, -0x1
-addiu      $a0, $a0, 0xA
-mflo       $t8
-srl        $t8, $t8, 7
-sb         $t8, -0x4($a0)
-multu      $v1, $t9
-srl        $t8, $t8, 16
-sb         $t8, -0x3($a0)
-mflo       $t9
-srl        $t9, $t9, 7
-sb         $t9, -0x2($a0)
-bnel       $t4, $zero, .L80070944
- nop
-addiu      $t0, $t0, -0x1
-bnel       $t0, $zero, .L800708F0
- nop
-jr         $ra
- nop
-endlabel calc_dyn_lighting_for_level_segment
-
-glabel func_80070A04
-lhu        $t4, 0x2($a2)
-.L80070A08:
-lhu        $t5, 0xE($a2)
-addiu      $a2, $a2, 0xC
-addiu      $t0, $t0, -0x1
-subu       $t4, $t5, $t4
-addu       $v0, $v0, $t4
-bnel       $t0, $zero, .L800708F0
- nop
-jr         $ra
- nop
-endlabel func_80070A04
-
-glabel area_triangle_2d
-mtc1       $a2, $f4
-mov.s      $f0, $f12
-mtc1       $a3, $f6
-sub.s      $f12, $f4, $f0
-mov.s      $f2, $f14
-lwc1       $f8, 0x10($sp)
-sub.s      $f14, $f6, $f2
-mul.s      $f12, $f12, $f12
-lwc1       $f10, 0x14($sp)
-sub.s      $f16, $f8, $f4
-mul.s      $f14, $f14, $f14
-li.s       $at, 0.5
-sub.s      $f18, $f10, $f6
-mul.s      $f16, $f16, $f16
-sub.s      $f0, $f0, $f8
-mul.s      $f18, $f18, $f18
-sub.s      $f2, $f2, $f10
-mul.s      $f0, $f0, $f0
-mtc1       $at, $f10
-add.s      $f12, $f12, $f14
-mul.s      $f2, $f2, $f2
-add.s      $f16, $f16, $f18
-sqrt.s     $f12, $f12
-sqrt.s     $f16, $f16
-add.s      $f0, $f0, $f2
-mtc1       $zero, $f2
-add.s      $f18, $f12, $f16
-sqrt.s     $f0, $f0
-add.s      $f18, $f18, $f0
-mul.s      $f18, $f10, $f18
-sub.s      $f4, $f18, $f12
-sub.s      $f8, $f18, $f0
-mul.s      $f0, $f4, $f18
-sub.s      $f6, $f18, $f16
-mul.s      $f6, $f6, $f8
-nop
-mul.s      $f0, $f0, $f6
-c.lt.s     $f0, $f2
-bc1fl      .L80070AD0
- nop
-mov.s      $f0, $f2
-.L80070AD0:
-jr         $ra
- sqrt.s    $f0, $f0
-endlabel area_triangle_2d
-
-glabel set_breakpoint
-ori        $a0, $a0, 0x1
-mtc0       $a0, $18
-addiu      $t0, $zero, 0xF
-mtc0       $t0, $19
-nop
-nop
-nop
-nop
-nop
-jr         $ra
- nop
-endlabel set_breakpoint
-
-glabel dmacopy_doubleword
-ld         $t0, 0x0($a0)
-ld         $t1, 0x8($a0)
-addi       $a1, $a1, 0x10
-addi       $a0, $a0, 0x10
-sd         $t0, -0x10($a1)
-bne        $a1, $a2, dmacopy_doubleword
- sd        $t1, -0x8($a1)
-jr         $ra
- nop
-endlabel dmacopy_doubleword

From 06a90513df591ee3237988768730f7be435e0933 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Fri, 19 Dec 2025 11:52:59 -0500
Subject: [PATCH 35/36] Fix yamls

---
 ver/splat/dkr.jpn.v79.yaml | 2 +-
 ver/splat/dkr.pal.v77.yaml | 2 +-
 ver/splat/dkr.pal.v80.yaml | 2 +-
 ver/splat/dkr.us.v80.yaml  | 2 +-
 4 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/ver/splat/dkr.jpn.v79.yaml b/ver/splat/dkr.jpn.v79.yaml
index 5e244da36..a3a046507 100644
--- a/ver/splat/dkr.jpn.v79.yaml
+++ b/ver/splat/dkr.jpn.v79.yaml
@@ -80,7 +80,7 @@ segments:
       - [0x6ADD0, c, joypad]
       - [0x6B380, c, game]
       - [0x6D000, c, thread3_main]
-      - [0x701F0, hasm, hasm/math_util]
+      - [0x701F0, hasm, hasm/ido/math_util]
       - [0x71810, c, memory]
       - [0x72A10, c, ../libultra/src/io/motor]
       - [0x72F30, c, save_data]
diff --git a/ver/splat/dkr.pal.v77.yaml b/ver/splat/dkr.pal.v77.yaml
index d6e679134..2ba3edda7 100644
--- a/ver/splat/dkr.pal.v77.yaml
+++ b/ver/splat/dkr.pal.v77.yaml
@@ -80,7 +80,7 @@ segments:
       - [0x6AD00, c, joypad]
       - [0x6B2B0, c, game]
       - [0x6CF30, c, thread3_main]
-      - [0x70110, hasm, hasm/math_util]
+      - [0x70110, hasm, hasm/ido/math_util]
       - [0x71730, c, memory]
       - [0x72930, c, ../libultra/src/io/motor]
       - [0x72E50, c, save_data]
diff --git a/ver/splat/dkr.pal.v80.yaml b/ver/splat/dkr.pal.v80.yaml
index bbaf805f7..cf4281e69 100644
--- a/ver/splat/dkr.pal.v80.yaml
+++ b/ver/splat/dkr.pal.v80.yaml
@@ -80,7 +80,7 @@ segments:
       - [0x6AF40, c, joypad]
       - [0x6B4F0, c, game]
       - [0x6D170, c, thread3_main]
-      - [0x70350, hasm, hasm/math_util]
+      - [0x70350, hasm, hasm/ido/math_util]
       - [0x71970, c, memory]
       - [0x72B70, c, ../libultra/src/io/motor]
       - [0x73090, c, save_data]
diff --git a/ver/splat/dkr.us.v80.yaml b/ver/splat/dkr.us.v80.yaml
index 3e4e71d78..bd8078a6d 100644
--- a/ver/splat/dkr.us.v80.yaml
+++ b/ver/splat/dkr.us.v80.yaml
@@ -80,7 +80,7 @@ segments:
       - [0x6AF40, c, joypad]
       - [0x6B4F0, c, game]
       - [0x6D170, c, thread3_main]
-      - [0x70350, hasm, hasm/math_util]
+      - [0x70350, hasm, hasm/ido/math_util]
       - [0x71970, c, memory]
       - [0x72B70, c, ../libultra/src/io/motor]
       - [0x73090, c, save_data]

From 8f42b3e61bd128e4c5296142200b05df6dbd5551 Mon Sep 17 00:00:00 2001
From: Ryan Myers <ryan.p.myers@gmail.com>
Date: Fri, 19 Dec 2025 11:55:06 -0500
Subject: [PATCH 36/36] woops, data too

---
 ver/splat/dkr.jpn.v79.yaml | 2 +-
 ver/splat/dkr.pal.v77.yaml | 2 +-
 ver/splat/dkr.pal.v80.yaml | 2 +-
 ver/splat/dkr.us.v80.yaml  | 2 +-
 4 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/ver/splat/dkr.jpn.v79.yaml b/ver/splat/dkr.jpn.v79.yaml
index a3a046507..1c314cf4c 100644
--- a/ver/splat/dkr.jpn.v79.yaml
+++ b/ver/splat/dkr.jpn.v79.yaml
@@ -290,7 +290,7 @@ segments:
       - [0xDF8A0, .data, joypad]
       - [0xDF8B0, .data, game]
       - [0xDF8E0, .data, thread3_main]
-      - [0xDF9D0, .data, hasm/math_util]
+      - [0xDF9D0, .data, hasm/ido/math_util]
       - [0xE09E0, .data, save_data]
       - [0xE0A40, .data, rcp_dkr]
       - [0xE0CE0, .data, ../libultra/src/sc/sched]
diff --git a/ver/splat/dkr.pal.v77.yaml b/ver/splat/dkr.pal.v77.yaml
index 2ba3edda7..8f9bdcc68 100644
--- a/ver/splat/dkr.pal.v77.yaml
+++ b/ver/splat/dkr.pal.v77.yaml
@@ -290,7 +290,7 @@ segments:
       - [0xDDF90, .data, joypad]
       - [0xDDFA0, .data, game]
       - [0xDDFD0, .data, thread3_main]
-      - [0xDE0C0, .data, hasm/math_util]
+      - [0xDE0C0, .data, hasm/ido/math_util]
       - [0xDF0D0, .data, save_data]
       - [0xDF120, .data, rcp_dkr]
       - [0xDF3C0, .data, ../libultra/src/sc/sched]
diff --git a/ver/splat/dkr.pal.v80.yaml b/ver/splat/dkr.pal.v80.yaml
index cf4281e69..e805aa37f 100644
--- a/ver/splat/dkr.pal.v80.yaml
+++ b/ver/splat/dkr.pal.v80.yaml
@@ -290,7 +290,7 @@ segments:
       - [0xDE500, .data, joypad]
       - [0xDE510, .data, game]
       - [0xDE540, .data, thread3_main]
-      - [0xDE630, .data, hasm/math_util]
+      - [0xDE630, .data, hasm/ido/math_util]
       - [0xDF640, .data, save_data]
       - [0xDF6A0, .data, rcp_dkr]
       - [0xDF940, .data, ../libultra/src/sc/sched]
diff --git a/ver/splat/dkr.us.v80.yaml b/ver/splat/dkr.us.v80.yaml
index bd8078a6d..ce20ebf94 100644
--- a/ver/splat/dkr.us.v80.yaml
+++ b/ver/splat/dkr.us.v80.yaml
@@ -290,7 +290,7 @@ segments:
       - [0xDE470, .data, joypad]
       - [0xDE480, .data, game]
       - [0xDE4B0, .data, thread3_main]
-      - [0xDE5A0, .data, hasm/math_util]
+      - [0xDE5A0, .data, hasm/ido/math_util]
       - [0xDF5B0, .data, save_data]
       - [0xDF610, .data, rcp_dkr]
       - [0xDF8B0, .data, ../libultra/src/sc/sched]