•RUY矩阵乘法库已启用(tflite_enable_ruy = on)。ruy矩阵乘法库与eigen和gemlowp的内核相比提供了更好的性能。• XNNPACK Delegate support ( TFLITE_ENABLE_XNNPACK=On ) • External Delegate support ( TFLITE_ENABLE_EXTERNAL_DELEGATE=On ) • (i.MX 95) GPU Delegate support ( TFLITE_ENABLE_GPU=On ) • The runtime library is built and provided as a shared library ( TFLITE_BUILD_SHARED_LIB=On ).如果优选将Tensorflow Lite库与应用程序的静态链接到应用程序(默认设置)。如第2.5.1节中所述,使用CMAKE构建应用程序,这可能很方便。•包含默认-O2优化级别的软件包。已知某些CPU内核(例如Resize_biarinear)在-O3优化级别上表现更好。但是,有些在-O2中表现更好,例如arg_max。我们建议根据应用程序需求调整优化级别。
• 启用 RUY 矩阵乘法库(TFLITE_ENABLE_RUY=On)。与使用 Eigen 和 GEMLOWP 构建的内核相比,RUY 矩阵乘法库提供了更好的性能。 • XNNPACK 委托支持(TFLITE_ENABLE_XNNPACK=On) • 外部委托支持(TFLITE_ENABLE_EXTERNAL_DELEGATE=On) • (i.MX 95)GPU 委托支持(TFLITE_ENABLE_GPU=On) • 运行时库以共享库的形式构建和提供(TFLITE_BUILD_SHARED_LIB=On)。如果希望将 TensorFlow Lite 库静态链接到应用程序,请将此开关保持关闭状态(默认设置)。如果应用程序是使用 CMake 构建的,可能会很方便,如第 2.5.1 节所述。 • 该包使用默认的 -O2 优化级别进行编译。某些 CPU 内核(例如 RESIZE_BILINEAR)在 -O3 优化级别下性能更佳。但是,某些内核(例如 ARG_MAX)在 -O2 优化级别下性能更佳。我们建议根据应用程序需求调整优化级别。